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Prefácio 


Este livro reúne o resultado da experiência de três professores da UFRJ e da coordena¬ 
dora do Treinamento em Métodos Estatísticos e suas Aplicações, também oferecido 
pela UFRJ, todos eles com longa dedicação ao ensino de qualidade. Tive ocasião de 
acompanhar a atividade de cada um, na pesquisa, no laboratório, na criação de novas 
formas de comunicação. Desse trabalho surgiu agora um texto abrangente, que apre¬ 
senta, de forma ao mesmo tempo clara e correta, os delicados conceitos fundamentais 
das teorias das Probabilidades e da Inferência Estatística. Merece especial destaque a 
presença de alguns tópicos da mais alta relevância prática. Por exemplo, a disponibili- 
zação de técnicas exploratórias para a identificação de observações discrepantes e assi¬ 
metrias. O tratamento desse tópico logo no capítulo inicial, assim como o dos modelos 
de regressão, no capítulo seguinte, coloca o leitor diante dos conceitos que estruturam 
a matéria e o habilitam a avançar com segurança pelos aspectos que tornam a Estatística 
tão interessante. O livro inclui um número considerável de exercícios desafiadores. A 
parte desses exercícios que é acompanhada de soluções as desenvolve cuidadosa e deta¬ 
lhadamente. É um produto que tenho grande satisfação de recomendar para estudantes 
de todas as inúmeras áreas de aplicação de Probabilidades e Estatística. 


ANNIBAL PARRACHO SANTANNA 



Carta aos leitores 


Talvez você seja uma pessoa que não gosta muito de Matemática, e menos ainda de 
Estatística. Isso não é problema. Ainda assim, gostaríamos de tentar convencê-lo a estu¬ 
dar pelo nosso livro. Nós o escrevemos pensando justamente em você. Nossa preocupa¬ 
ção foi, o tempo todo, tornar a leitura do material teórico menos árida e menos fria. 

Nesse sentido, para cada capítulo do livro, adotamos a estratégia de: 

• Começar com a lista dos conceitos a serem introduzidos no capítulo. 

• Abrir a discussão sempre com uma situação concreta, em que o material teórico a 
ser estudado contenha métodos estatísticos táteis para uma abordagem quantitati¬ 
va do problema. 

• Quando julgamos pertinente, estabelecer um paralelo da teoria com tais situações 
concretas. 

• Evitar desenvolvimentos de natureza puramente abstrata (tais como demonstra¬ 
ções matemáticas), porém mantendo o nível de rigor que nos pareceu adequado, 
dado o conteúdo a ser apresentado. 

• Complementar a teoria com vários exemplos, relativos a diferentes áreas de apli¬ 
cação da Estatística, bem como a questões da vida cotidiana. Cada exemplo é fina¬ 
lizado por um marcador. ■ 

• Concluir com um resumo do material apresentado no capítulo. 

• Final mente incluir uma relação de exercícios resolvidos e exercícios propostos, 
também procurando abranger várias áreas do conhecimento em que a Estatística 
seja considerada uma ferramenta útil. 

O material teórico deste livro pode ser dividido em três partes: 

• Análise Exploratória (Capítulos 1 e 2) 

• Cálculo de Probabilidades (Capítulos 3, 4 e 5) 

• Inferência Estatística (Capítulos 6, 7 e 8). 

Ao linal lia lambem um apêndice, no qual incluímos, resumidamente, alguns coneei 
los ( resultados malemalicos que sao utilizados no lexlo. No site www.elseviei .com.br 
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-► Universitários -*■ Estalíslica -► Eslaiíslica Básica A arle de trabalhar com dados -*■ 
Conteúdos Extras, você encontrara: Demonstrações de alguns resultados leoru os Bla 
nilhas com conjuntos de dados em Excel, Respostas as perguntas do lexto, Soluções de 
alguns exercícios propostos. 

Gostaríamos de agradecer pelo trabalho competente e cuidadoso de ( ristina Pirnen 
ta de Mello Spineti, que colaborou na revisão dos exemplos e dos exercícios deste livro 

Mas, afinal, como a Estatística pode ser útil aos leitores, mesmo que estes não sejam 
da área quantitativa? 

A Estatística pode ser vista como uma importante ferramenta de uso generalizado 
nas mais variadas áreas do conhecimento. 

Apresentamos brevemente a seguir alguns exemplos de questões da vida real em que o 
uso dos métodos estatísticos se revela importante na obtenção de respostas adequadas. 

Fornecendo subsídios para uma política de melhoria das condições 
sanitárias 

Florence Nightingale foi a fundadora, em 1860, da primeira escola de enfermagem 
do mundo. Sempre teve a preocupação de melhorar as condições de atendimentos aos 
doentes. Durante a guerra da Criméia, entre 1854 e 1856, ela integrou o corpo de enfer¬ 
magem britânico na Turquia, onde ficou famosa por seu trabalho pioneiro destinado ao 
tratamento de feridos de guerra. Ela observou, durante a guerra, que o número de mor¬ 
tes ocasionadas pelas más condições sanitárias dos acampamentos e dos hospitais de 
campanha foi maior que as ocorridas em combate. Usando tabelas e gráficos, mormente 
gráficos setoriais, ou de “pizza”, ela conseguiu convencer as autoridades encarregadas 
da administração hospitalar da necessidade de melhorar as condições sanitárias, o que 
redundou numa dramática diminuição no número de mortes. A utilização de gráficos 
de “pizza” - como os estudados no Capítulo 1 - foi suficiente para mostrar que as mor¬ 
tes devidas às más condições sanitárias superavam as ocorridas no campo de batalha, 
ajudando na decisão de elaborar uma política de melhoria dessas condições. 

Ocorrência de sinistros em determinados turnos de trabalho 

Constatou-se que, inesperadamente, houve um inusitado aumento no número de 
óbitos em um determinado hospital. Os números ultrapassavam em muito a quantida¬ 
de de mortes ali comumente registradas. Foi feito um levantamento de dados com o ob¬ 
jetivo de estabelecer um padrão para os diversos óbitos. Para cada um dos últimos 
meses, foi calculada a média de óbitos diários por turno da equipe de enfermagem, e a 
análise dos dados observados revelou que, em alguns turnos, a média de óbitos era su¬ 
perior em pelo menos três vezes à média dos demais turnos. Com essa constatação, pas¬ 
sou-se a analisar a composição da equipe de cada turno. Observou-se então que as 
médias que fugiam aos padrões coincidiam com os turnos de um determinado enfermei¬ 
ro. A comparação entre o número de óbitos ocorridos no turno desse enfermeiro e nos 
outros turnos forneceu indícios da culpabilidade desse profissional. 

Aqui, novamente, as técnicas estatísticas utilizadas seriam aquelas que constam dos 
Capítulos 1 e 2 deste livro. 
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Detecção de fraudes no Imposto de Renda 

Suspeita-se que, ao preencher a sua declaração anual do Imposto de Renda, muitos 
contribuintes praticam a chamada sonegação ou evasão fiscal. Ou seja, eles “omitem” 
rendimentos de fato auferidos e “acrescentam” gastos inexistentes, visando pagar me¬ 
nos imposto. É claro que o fisco pode lançar mão de informações individuais existen¬ 
tes em outros cadastros e cruzá-las com as declarações de renda dos indivíduos. 
Assim, por exemplo, pode ficar caracterizado como evidente que a renda declarada 
por uma pessoa é incompatível com a sua variação patrimonial. Através de análises 
estatísticas desses dados, é possível elaborar um sistema eficaz de “malha”, capaz de 
detectar com bastante precisão a ocorrência de tais infrações à legislação tributária. A 
discussão apresentada no Capítulo 1 sobre identificação de outliers, embora só permi¬ 
ta abordar essa questão em um nível superficial, pode viabilizar que seja dado um pri¬ 
meiro passo nessa direção. 

Teste para diagnosticar a presença de uma doença 

A pesquisa na área médica desenvolve frequentemente testes para a detecção de deter¬ 
minadas enfermidades. Ocorre que esses testes não são infalíveis. Quando se aplica um 
teste a uma pessoa, o resultado pode ser positivo e, mesmo assim, a doença pode estar au¬ 
sente. Assim como o resultado pode ser negativo, embora a doença esteja presente. 

Para lidar com esse tipo de questionamento, a Bioestatística criou conceitos como os 
de Sensibilidade (probabilidade de o teste dar positivo, quando a doença está presente), 
Especificidade (probabilidade de o teste dar negativo, quando a doença está ausente), 
Poder Preditivo (Positivo e Negativo) de um teste. Quanto mais sensível e mais especí¬ 
fico for o teste, maior será a sua capacidade de levar a diagnósticos corretos. Mesmo em 
sua versão mais simples, conceitos como os citados anteriormente se utilizam da noção 
básica de probabilidade condicional e estão interligados pelo chamado Teorema de 
Bayes (ver Capítulo 3). 

Área de Recursos Humanos - Irregularidades no processo de seleção 

O setor de recrutamento e seleção da área de Recursos Humanos de uma empresa 
realizou um processo de seleção para o preenchimento de vagas. No exame de seleção 
foi aplicada uma prova de múltipla escolha com 80 perguntas, cada uma delas admitin¬ 
do cinco opções de resposta: a, b, c, d, e. Houve uma denúncia de “cola” durante a apli¬ 
cação da prova. Como a Estatística poderia ajudar a verificar se realmente há indícios de 
“cola”? 

Através da teoria de probabilidade (Capítulo 3) pode-se avaliar quão pequena é a 
chance de dois ou mais candidatos, exclusivamente por acaso, marcarem respostas 
iguais na maior parte das questões (por exemplo, em 60 questões), quando entre elas 
houver um número não desprezível de respostas erradas - digamos, 10 erradas, (ver o 
Exercício Resolvido 1 do Capítulo 3). 

Simulação do funcionamento de um porto de importação e exportação 

I la determinadas calegoi ias cie problemas de natureza probabihstica cujo tratamen¬ 
to analítico torna-se quase impralii avel, mesmo quando a complexidade do problema 
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ainda não é Ião grande. Alguns exemplos seriam os problemas de formação de filas, ge¬ 
rência de estoques etc. Felizmente tais problemas podem ser abordados através de uma 
metodologia chamada Simulação por Monte Cario, que usa a geração de números alea¬ 
tórios no computador. 

Para exemplificar, consideremos o funcionamento de um porto de importação e ex¬ 
portação. Cada navio que chega entra numa fila de espera, manobra, atraca, é descarre¬ 
gado, é abastecido, sofre manutenção, é recarregado, desatraca, manobra novamente e 
finalmente parte para seu próximo destino. Através da Simulação, tudo se passa como 
se o pesquisador pudesse se sentar em um ponto de observação e ir registrando cada 
uma dessas ocorrências, muitas delas simultâneas, e sua evolução ao longo do tempo. 
Isso pode ser feito programando devidamente o gerador para sortear números aleató¬ 
rios segundo diferentes leis de probabilidade, vistas nos Capítulos 4 e 5. 

Pesquisa de Clima Organizacional 

Uma empresa tem observado a ocorrência de atos de vandalismo por parte de alguns 
dos seus empregados. Por que isso estaria acontecendo? Visando melhor conhecer as 
opiniões do seu corpo de empregados sobre o dia-a-dia na empresa, a diretoria enco¬ 
menda a uma empresa de consultoria a elaboração de uma Pesquisa de Clima Organiza¬ 
cional. Para isso é elaborado um questionário abordando temas, tais como: benefícios, 
condições de trabalho, treinamento, questões de segurança, comunicação interna etc. 
Seleciona-se uma amostra de empregados a serem entrevistados. A expectativa da dire¬ 
toria é, através dessa pesquisa, obter subsídios para a implantação de medidas que ve¬ 
nham a aperfeiçoar o relacionamento entre os empregados e a empresa, o que poderá 
resultar em melhorias no seu processo produtivo. 

O material apresentado nos Capítulos 2, 6 e 8 trata de algumas das questões aqui le¬ 
vantadas. 

Pesquisa eleitoral 

Ao longo dos meses que precedem a realização de uma eleição, o noticiário dos mei¬ 
os de comunicação costuma estar fervilhando de novidades a respeito das preferências 
do eleitorado. Nesse sentido, as pesquisas eleitorais são um importante instrumento de 
que se dispõe para “fotografar com nitidez” a realidade eleitoral em um dado momento 
da campanha. 

É então inevitável que o leigo, cético e desconfiado pergunte: “Se a população é 
composta de milhões de eleitores, como é possível obter estimativas confiáveis do 
percentual de eleitores que pretendem votar em cada candidato com base em apenas al¬ 
gumas milhares de entrevistas?” 

A Teoria da Amostragem (brevemente introduzida no Capítulo 6) nos garante que isso 
é perfeitamente possível, desde que a pesquisa eleitoral obedeça a um planejamento sério 
e cuidadoso e a critérios de qualidade rigorosos na execução de todas as etapas do proces¬ 
so. Ou seja, havendo competência, neutralidade e lisura por parte de quem faz a pesquisa, 
ela pode realmente fornecer estimativas precisas das intenções de voto do eleitorado. 

Esse tipo de pesquisa se baseia em uma amostra, e não na população inteira. Então, 
por mais criterioso que tenha sido o procedimento de seleção dos entrevistados, não se 
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podem esperar estimativas absolutamente corretas dos percentuais relativos aos diver¬ 
sos candidatos. Ou seja, é inevitável a existência de erros de estimação. Em particular, 
podem ser obtidos intervalos de confiança para os percentuais de intenção de voto de 
cada candidato (ver Capítulo 7). 

Entretanto, há um diferencial importante entre a pesquisa eleitoral e a maioria dos 
demais tipos de pesquisa de opinião. No caso da pesquisa eleitoral, sempre haverá uma 
eleição para comprovar se a previsão da “boca de urna” estava correta ou não. 

A Lingüística, a Fonoaudiologia e a Estatística unidas no diagnóstico de 
crianças disléxicas 

Existe uma hipótese de que as crianças com dislexia têm problema de acesso às pala¬ 
vras, porque elas têm dificuldade com suas representações sonoras. Essa hipótese se 
sustenta em evidências obtidas através de testes de nomeação de palavras a partir de fi¬ 
guras. O esperado é que, nesses testes, as crianças com desenvolvimento normal e da 
mesma faixa etária, o chamado grupo controle, apresentem alto índice de acerto. 

Foi aplicado um teste de nomeação a nove crianças disléxicas. Esse teste envolvia 36 
palavras, sendo: 

• nove dissilábicas e com alta freqüência de uso; 

• nove dissilábicas e com baixa freqüência de uso; 

• nove polissilábicas e com alta freqüência de uso; 

• nove polissilábicas e com baixa freqüência de uso. 

Os resultados revelaram que a dificuldade da criança disléxica está associada princi¬ 
palmente ao efeito da freqüência de uso, e não ao efeito do tamanho da palavra na recu¬ 
peração da sua forma sonora. Outro resultado interessante é o que compara a 
proporção de acertos da primeira resposta com a proporção de acertos após a apresenta¬ 
ção de “dicas” semânticas e fonológicas para que a criança recupere a forma sonora da 
palavra. Essa diferença evidencia que a criança disléxica não tem problema para repre¬ 
sentar em sua mente a forma sonora das palavras, mas pode apresentar dificuldade para 
acessar essa memória, quando deseja compreender ou se expressar verbalmente. 

Aqui foram usados testes de hipótese, abordados no Capítulo 8, para comparar os 
desempenhos dos dois grupos: o das crianças disléxicas e o grupo de controle. 

Água contaminada 

O seguinte fato é narrado no filme O despertar de uma paixão (The painted veil), basea¬ 
do em uma obra de W. Somerset Maugham. Na China de 1925, um bacteriologista bri¬ 
tânico foi enviado ao povoado de M ei-Tan-Fu, situado à beira de um afluente do rio 
Yangtzé , assolado por uma epidemia de cólera. Ele observou, surpreso, que enquanto a 
população de Mei-Tan-Fu estava quase toda doente, com um grande número de óbitos 
decorrentes da enfermidade, no povoado vizinho, situado rio acima, o numero registra¬ 
do de doentes e casos de óbitos era quase insignificante. Uma análise da água do rio à 
frente dos dois povoados mostrou que a água bebida pelos habitantes de Md- Tan-Fa es¬ 
tava contaminada, ao contrário do que ocorria com a água consumida pelo povo rio aci¬ 
ma Descobriu-se que a razão disso era a existência de um cemitério a beirado rio, entre 
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as duas localidades. A erradicação do cemitério não foi possível devido as crenças dos 
nativos, para os quais a água purificava os espíritos dos mortos. A solução encontrada 
foi impedir o consumo da água do rio extraída em frente a M ei-Tan-Fu e a construção de 
um engenho para extrair água rio acima, e transportá-la àquela localidade. A simples 
comparação entre os casos de cólera observados nos dois povoados ribeirinhos levou a 
ações que permitiram desvendar o aparente mistério do surto de cólera. 

Nesse caso, uma forma possível de se constatar a diferença entre os dois povoados, 
em termos da qualidade da água, seria, por exemplo, a coleta de amostras (a serem ana¬ 
lisadas quimicamente) em ambos os locais, e a posterior comparação entre elas através 
de um teste de hipótese (ver Capítulo 8). 

Amigo leitor, esperamos que este livro contribua para que você goste mais da Estatís¬ 
tica, a ciência que, pela sua beleza e ampla aplicabilidade aos mais diversos ramos do 
conhecimento, escolhemos tornar o centro da nossa atividade profissional. 

Boa viagem pelo mundo da Estatística, a arte de trabalhar com dados! 


OS AUTORES 

Rio de Janeiro, setembro de 2008. 
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CAPÍTULO I 


ANÁLISE EXPLORATÓRIA 
PARA UMA VARIÁVEL 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• População e amostra 

• Observações e variáveis 

• Variável qualitativa x variável quantitativa 

• Tabela de frequências 

• Gráfico de barras e gráfico de setores 

• Histograma e gráfico ramo-folha 

• Média, mediana e moda 

• Variância, desvio-padrão, coeficiente de variação e distância 
interquartil 

• Resistência de uma medida 

• Valores discrepantes ( Outliers ) 

• Box plot 


Diego e Walter trabalhavam, havia muitos anos, na fábrica de camisas masculinas Colarinho 
Branco. Um dia, o gerente de produção pediu demissão para ir trabalhar numa empresa multi¬ 
nacional do ramo. 0 dono da Colarinho Branco, Sr. Paulo, chamou então seus dois experientes 
empregados para comunicar-lhes que um deles seria o novo gerente de produção. Contudo, dis¬ 
se-lhes que essa escolha dependeria de um pequeno teste ao qual ambos seriam submetidos. 
Ele pediu a cada um dos dois que: 

• selecionasse amostras de 200 homens adultos; 

• medisse a circunferência do pescoço de cada indivíduo dessas amostras; 

• apresentasse por escrito um relatório com as suas conclusões. 

Logo no segundo dia após ter começado as medições, Walter compareceu sorridente perante 
Sr. Paulo para apresentar o seu trabalho. Ele não tinha mais dúvidas de que seria o escolhido. 




2 ESTATÍSTICA BÁSICA 


ELSEVIER 


Passaram-se mais um, dois, três dias, e somente quatro dias depois Diego entregou o seu traba¬ 
lho. No quinto dia, o dono da empresa anunciou: Diego será o novo gerente de produção. 

Walter não conseguia entender o porquê da escolha, que ele considerava injusta, e foi inter¬ 
pelar o Sr. Paulo. Expôs os seus motivos e lembrou que tinha entregado o seu trabalho quatro 
dias antes de Diego. 

O Sr. Paulo então, calmamente, o chamou ao seu lado e mostrou-lhe os dois trabalhos. O relató¬ 
rio de Walter estava caprichado sim, com as pessoas ordenadas alfabeticamente e seus respecti¬ 
vos tamanhos de colarinho. “Bonito o teu trabalho”, falou o Sr. Paulo, “só que de nada me serve." A 
seguir mostrou o relatório que Diego tinha apresentado. As pessoas não estavam ordenadas alfa¬ 
beticamente, mas por tamanho de colarinho. “Você vê”, falou o dono, “agora eu sei quais são os ta¬ 
manhos extremos, o menor e o maior." “Além disso", e mostrou-lhe uma tabela de frequências 
apresentada por Diego, “posso ver imediatamente qual o tamanho de colarinho que tenho de fa¬ 
bricar em maior quantidade e as proporções correspondentes aos outros tamanhos. ” A seguir mos¬ 
trou um histograma em que claramente podia ser vista a distribuição dos diversos tamanhos de 
colarinhos. E ainda tinha mais. No seu trabalho, Diego tinha calculado o tamanho médio dos colari¬ 
nhos, o seu desvio-padrão e tinha feito um gráfico de caixas (box-plot), no qual sobressaíam nitida¬ 
mente os quartis inferior e superior e a mediana para a amostra de colarinhos. 

Walter ficou admirado com o trabalho de Diego. Percebeu que todas as informações apre¬ 
sentadas por ele eram de fato relevantes para a produção de camisas. Diante de tantas evi¬ 
dências, ele aceitou as explicações do Sr. Paulo e foi cumprimentar o colega recém-promovido. 
No dia seguinte, inscreveu-se em um treinamento em Métodos Estatísticos que em breve seria 
oferecido por uma conceituada universidade. 

No caso relatado, Diego apresentou um trabalho muito mais completo que o de Walter, gra¬ 
ças ao seu conhecimento das técnicas de Análise Exploratória de dados, como as que serão apre¬ 
sentadas nesta obra. 


1.1 INTRODUÇÃO 

O que é analisar ciados? 

Aqui estão algumas possibilidades de resposta a essa pergunta: 

Analisar dados é... 

• identificar comportamentos médios, comportamentos discrepantes, comparar com¬ 
portamentos, investigar a interdependência entre variáveis, revelar tendências etc. 

• a partir de uma massa de dados, e com o auxílio dos recursos computacionais, se¬ 
parar o que é essencial (estrutura) do que é eventual (ruído). 

• resumir, de forma eficiente, a informação contida nos dados e assim permitir que, 
através desse conhecimento, as decisões sejam tomadas de forma mais consciente. 

O que é Análise Exploratória? 

Trata-se de um conjunto de técnicas de tratamento de dados que, sem implicar em 
uma fundamentação matemática mais rigorosa, nos ajuda a fazer uma sondagem do ter¬ 
reno, ou seja, tomar um primeiro contato com a informação disponível. 
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Supostamente, os dados “estão tentando nos dizer algo” a respeito do tema que estamos 
investigando. Como extrair e resumir a informação que está contida nos dados? Como de¬ 
vemos usar essa informação para obter mais familiaridade com o problema a ser abordado? 

No filme Depois daquele beijo (Blow up), de M. Antonioni (1966), um clássico do cinema, 
um fotógrafo amador se encanta pela graciosidade de uma jovem e resolve segui-la em seu pas¬ 
seio pelas ruas da cidade, registrando tudo com fotos e mais fotos dos mais variados ângulos. Em 
determinado momento, ela vai ao encontro de um homem em um parque muito arborizado. O 
casal corre feliz pelos campos, se abraça e se beija longamente, e tudo isso é registrado pela câ¬ 
mera do incansável fotógrafo. 

Mais tarde, de volta ao seu estúdio, ele se dedica ao trabalho de revelar cada uma das ima¬ 
gens (não era chegado ainda o tempo das fotos digitais), e esse exame minucioso, cheio de am¬ 
pliações de detalhes aqui e ali, acaba por sugerir que, no meio da mata, há um corpo caído no 
chão (talvez um cadáver), o que poderia ser indício de um crime, descoberto inteiramente por 
acaso. Convém ressaltar que essa descoberta só foi possível devido ao fato de o fotógrafo ter exa¬ 
minado (explorado) mais detalhadamente o material (dados) que ele tinha fotografado. 

Mal comparando, às vezes é assim que descobertas são realizadas quando usamos as técni¬ 
cas da Análise Exploratória para extrair a informação relevante de um conjunto de dados. 



Essas técnicas freqüentemente nos levarão à construção de tabelas e, sobretudo, de 
gráficos que pretendem facilitar a nossa compreensão do fenômeno em estudo, apelan¬ 
do para o poder de visualização do ser humano. Esse é o assunto a ser abordado nos Ca¬ 
pítulos 1 e 2 deste livro. 

O que vem depois da Análise Exploratória? 

Uma vez de posse das “pistas” a respeito do tema em estudo que nos foram forneci¬ 
das pela Análise Exploratória, podemos partir para a chamada Inferência, em que serão 
aplicados aos dados métodos estatísticos mais sofisticados, cuja fundamentação mate¬ 
mática está no Cálculo de Probabilidades. 

Nessa segunda fase da análise, que será abordada a partir do Capítulo 3, veremos: 

• como formular um modelo probabilístico que pretende descrever matematica¬ 
mente o fenômeno de interesse (Capítulos 3, 4 e 5); 

• como adentrar no mundo da Inferência Estatística, aprendendo a lidar com o con¬ 
ceito de Amostragem e, em particular, com grandes amostras (Capítulo 6); 

• como estimar os parâmetros de um modelo probabilístico, fazendo uma espécie 
de calibração ou ajuste fino (Capítulo 7); 

• como testar hipóteses comportamentais acerca do assunto em consideração (Ca¬ 
pítulo 8). 


1.2 POPULAÇÃO E AMOSTRA 

A palavra “população”, na sua acepção mais comum, representa o conjunto dos ha¬ 
bitam es de um país ou de uma dada região Em Estatística, o termo e usado em um sen- 
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tido mais amplo. Diremos que população (ou universo) é o conjunto de todos os 
elementos (pessoas ou objetos) cujas propriedades o pesquisador está interessado em 
estudar. Essas propriedades podem ser: o resultado de uma medição, um atributo quali¬ 
tativo, um índice etc. Por exemplo: cor de olhos, estatura, tempo de reação etc. 

Quando é feito um levantamento completo sobre uma determinada população, ou 
seja, contemplando cada um dos seus elementos, temos o que se chama de um censo. 

Em termos do número dos elementos que compõem a população, ela pode ser classi¬ 
ficada como finita ou infinita. Os empregados de uma empresa, as agências de um ban¬ 
co, as ruas de uma cidade etc. são exemplos de populações finitas. Já os pontos de uma 
linha, o conjunto dos números reais etc. constituem populações infinitas. 

Pela própria natureza dos exemplos anteriores, vemos que, nas situações mais con¬ 
cretas do mundo real, estamos sempre lidando com populações finitas. Por outro lado, 
as populações ditas infinitas resultam de uma abordagem mais abstrata da realidade. 

Quando uma população, embora finita, é muito grande, ela é tratada, na prática, 
como se fosse infinita. 

Se uma população é infinita, ou finita mas muito grande, torna-se impossível ou im¬ 
praticável a realização do censo. Em tais casos, em vez disso, examina-se somente uma 
pequena parte da população que chamamos de amostra. 

Uma amostra é dita representativa da população se a partir de sua análise podem ser 
obtidas conclusões válidas sobre a população. Para tanto é necessário que a amostra seja 
extraída de acordo com regras bem definidas. É claro que, se a população da qual a amos¬ 
tra é retirada é muito homogênea, essa preocupação não é tão importante, pois, então, 
qualquer tipo de amostragem nos levaria inapelavelmente ao mesmo resultado. É o que 
ocorre, por exemplo, quando se extrai uma amostra de um fluido. Umas poucas gotas 
podem ser suficientes para dar a informação desejada, como acontece em um exame de 
sangue. Entretanto, quando o material de que está composta a população é muito hete¬ 
rogêneo, como freqüentemente ocorre em situações de interesse prático, a maneira 
como essa amostra é selecionada é um assunto da maior relevância. Nesses casos, é 
muito importante o uso de técnicas que nos garantam a obtenção de amostras dignas de 
confiança. 

Para finalizar essas considerações iniciais sobre os conceitos de população e amos¬ 
tra, cabe aqui um comentário de ordem prática. 

Em determinadas situações concretas é perfeitamente válido encararmos a popula¬ 
ção disponível como uma amostra representativa de uma população maior. 

Por exemplo: 

• A população de todos os pacientes que, num determinado momento, estão inter¬ 
nados em um grande hospital de Cardiologia, para efeitos práticos, pode ser enca¬ 
rada como uma amostra representativa da população de todos os pacientes que so¬ 
frem de distúrbios cardíacos. 

• A população dos alunos inscritos na disciplina Estatística de um determinado cur¬ 
so de graduação, para efeitos práticos, pode ser vista como uma amostra represen¬ 
tativa da população de todos os alunos desse curso que cursaram essa disciplina ao 
longo de um período de, digamos, cinco anos. 


ELSEVTER 


ANÁLISE EXPLORATÓRIA PARA UMA VARIÁVEL 5 


Sendo assim, se os seus dados a princípio lhe parecem representar toda uma popula¬ 
ção, talvez valha a pena perguntar a si mesmo se, na verdade, seu propósito não seria ex¬ 
trapolar as conclusões a que você eventualmente chegar para uma realidade maior. Se 
tor esse o caso, os dados devem ser encarados como uma amostra e não uma população. 

Podemos resumir esses conceitos no quadro a seguir: 


População: Coleção completa de todos os elementos que são objeto de nosso estudo. 
Censo: Exame de todos os elementos da população. 

Amostra: Subconjunto de elementos selecionados da população segundo regras 
bem definidas. 


1.3 TIPOLOGIA DAS VARIÁVEIS 

Quando é feito um levantamento de dados a respeito de um determinado assunto, eles 
costumam ser representados em uma tabela de dados brutos como a tabela a seguir, na qual 
cada linha corresponde a uma observação e cada coluna corresponde a uma variável. 

As observações também são às vezes chamadas de indivíduos, sujeitos, objetos, ca¬ 
sos, unidades amostrais etc. As variáveis também costumam ser referidas como atribu¬ 
tos, características, propriedades etc. 

EXEMPLO i.l Imóveis à venda 

A Tabela 1.1a seguir mostra os dados brutos de uma amostra de 27 imóveis anuncia¬ 
dos para venda nos anúncios classificados de um jornal. 


TABELA I.l Amostra sistemática, de 20 em 20, dos imóveis 
anunciados para venda nos anúncios classificados de um jornal 


N- da Obs. 

Bairro 

Tipo 

N- de quartos 

Preço* 

1 

Barra 

Apto. 

2 

165 

2 

Barra 

Apto. 

3 

240 

3 

Barra 

Cobt. 

- 

158 

4 

Barra 

Sala 

- 

150 

5 

Botafogo 

Apto. 

2 

59 

6 

Catete 

Apto. 

1 

54 

7 

Centro 

Sala 

- 

35 

8 

Copacabana 

Apto. 

2 

83 

9 

Copacabana 

Apto. 

3 

180 

10 

Copacabana 

Apto. 

4+ 

85 

1 1 

Flamengo 

Apto. 

1 

58 

12 

Flamengo 

Cobt. 

- 

120 

13 

Gávea 

Apto. 

4+ 

250 

14 

Ipanema 

Apto. 

3 

130 

15 

Jacarepaguá 

Apto. 

3 

90 

16 

Lagoa 

Apto. 

2 

130 

17 

Laranjeiras 

Apto. 

2 

68 

18 

Laranjeiras 

Apto. 

4+ 

360 

19 

Leblon 

Apto. 

3 

300 
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N- da Obs. 

Bairro 

Tipo 

N- c/e quartos 

Preço 

20 

Leblon 

Apto. 

4 + 

600 

21 

Maracanã 

Apto. 

3 

;/ 

22 

Recreio 

Cobt. 


240 

23 

São Conrado 

Casa 

4+ 

650 

24 

Tijuca 

Apto. 

2 

49 

25 

Tijuca 

Apto. 

2 

95 

26 

Tijuca 

Casa 

4+ 

170 

27 

Vila Isabel 

Apto. 

2 

57 


* em unidades monetárias (u.m.) 


Nesse exemplo cada observação é um imóvel, e cada variável é um atributo dos imó¬ 
veis (bairro, tipo, número de quartos, preço). 


As variáveis, de uma forma geral, podem ser classificadas em tipos, conforme o se¬ 
guinte: 


Qualitativa - 


Variável< 


Quantitativa < 


Nominal 

Ordinal 

Discreta 

Contínua 


Variável qualitativa nominal ou categórica - seus valores possíveis são diferentes 
categorias não-ordenadas, em que cada observação pode ser classificada. Exem¬ 
plos: raça, nacionalidade, área de atividade. 

Variável qualitativa ordinal - seus valores possíveis são diferentes categorias or¬ 
denadas, em que cada observação pode ser classificada. Exemplos: classe social, 
nível de instrução. 

Variável quantitativa discreta - seus valores possíveis são em geral resultados de 
um processo de contagem. Exemplos: número de filhos, número de séries escola¬ 
res cursadas com aprovação. 

Variável quantitativa contínua - seus valores possíveis podem ser expressos atra¬ 
vés de números reais e varrem uma escala contínua de medição. Exemplos: renda 
mensal, peso, altura. 


PERGUNTA: Como você classificaria por tipo cada uma das variáveis da Tabela 1.1? 

EXEMPLO 1.2: Pesquisa antropométrica 

A Tabela 1.2 a seguir apresenta um conjunto de dados brutos de uma pesquisa antro¬ 
pométrica realizada com mulheres cuja idade está acima de 60 anos. Este conjunto de 
dados será usado ao longo de todo este capítulo para exemplificar vários dos conceitos a 
serem aqui estudados. 
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TABELA 1.2 Pesquisa antropométrica: amostra 
de 45 mulheres idosas acima de 60 anos 


Ident 

Categ. 

Idade 

Peso 

(kg) 

Altura 

(cm) 

IMC 

(kg/m 2 ) 

Classe 

IMC 

Cintura 

(cm) 

Quadril 

(cm) 

RCQ 

Classe 

RCQ 

IDI 

A 

61 

58,2 

154,0 

24,5 

normal 

87 

109 

0,80 

MR 

ID2 

S 

69 

63,0 

152,0 

27,3 

sobrepeso 

89 

104 

0,86 

GR 

ID3 

S 

61 

70,1 

158,0 

28,1 

sobrepeso 

106 

123 

0,86 

GR 

ID4 

S 

71 

73,2 

156,0 

30,1 

sobrepeso 

1 10 

122 

0,90 

GR 

ID5 

A 

63 

58,6 

152,0 

25,4 

sobrepeso 

99 

121 

0,82 

MR 

ID6 

S 

71 

77,0 

160,0 

30,1 

sobrepeso 

125 

132 

0,95 

GR 

ID7 

S 

72 

76,2 

165,0 

28,0 

sobrepeso 

1 15 

125 

0,92 

GR 

ID8 

s 

68 

59,8 

160,0 

23,4 

normal 

85 

103 

0,83 

MR 

ID9 

A 

66 

64,3 

155,0 

26,8 

sobrepeso 

100 

120 

0,83 

MR 

ID10 

S 

69 

52,1 

151,0 

22,8 

normal 

74 

83 

0,89 

GR 

IDI 1 

S 

72 

62,0 

156,0 

25,5 

sobrepeso 

90 

1 1 1 

0,81 

MR 

IDI 2 

S 

67 

52,1 

151,0 

22,8 

normal 

76 

90 

0,84 

MR 

IDI 3 

S 

63 

58,0 

157,0 

23,5 

normal 

80 

102 

0,78 

MR 

IDI 4 

S 

66 

55,0 

154,0 

23,2 

normal 

78 

96 

0,81 

MR 

IDI 5 

S 

63 

50,1 

157,0 

20,3 

normal 

72 

81 

0,89 

GR 

IDI 6 

A 

63 

57,9 

160,0 

22,6 

normal 

78 

90 

0,87 

GR 

IDI 7 

A 

60 

58,2 

156,0 

23,9 

normal 

80 

108 

0,74 

PR 

IDI 8 

A 

67 

56,2 

152,0 

24,3 

normal 

76 

95 

0,80 

MR 

ID 9 

A 

71 

68,6 

159,0 

27,1 

sobrepeso 

106 

1 17 

0,91 

GR 

ID20 

A 

63 

51,0 

150,0 

22,7 

normal 

71 

83 

0,86 

GR 

ID2I 

A 

60 

53,4 

150,0 

23,7 

normal 

76 

89 

0,85 

MR 

ID22 

A 

69 

61,3 

154,0 

25,8 

sobrepeso 

89 

106 

0,84 

MR 

ID23 

A 

64 

53,2 

158,0 

21,3 

normal 

73 

86 

0,85 

MR 

ID24 

A 

63 

54,6 

150,0 

24,3 

normal 

80 

108 

0,74 

PR 

ID25 

A 

66 

56,2 

152,0 

24,3 

normal 

84 

1 10 

0,76 

PR 

ID26 

A 

71 

60,3 

156,0 

24,8 

normal 

82 

99 

0,83 

MR 

ID27 

A 

64 

54,7 

158,0 

21,9 

normal 

76 

95 

0,80 

MR 

ID28 

A 

70 

60,0 

160,0 

23,4 

normal 

81 

104 

0,78 

MR 

ID29 

A 

63 

51,3 

154,0 

21,6 

normal 

76 

89 

0,85 

MR 

ID30 

A 

66 

50,0 

153,0 

21,4 

normal 

76 

87 

0,87 

GR 

ID3I 

A 

64 

49,8 

150,0 

22,1 

normal 

72 

106 

0,68 

PR 

ID32 

A 

69 

55,2 

156,0 

22,7 

normal 

81 

98 

0,83 

MR 

ID33 

A 

69 

58,2 

160,0 

22,7 

normal 

78 

90 

0,87 

GR 

ID34 

S 

64 

51,6 

156,5 

21,1 

normal 

76 

87 

0,87 

GR 

ID35 

S 

63 

62,7 

153,0 

26,8 

sobrepeso 

90 

103 

0,87 

GR 

ID36 

S 

72 

75,6 

165,0 

27,8 

sobrepeso 

98 

1 10 

0,89 

GR 

ID37 

S 

73 

65,2 

154,0 

27,5 

sobrepeso 

96 

1 10 

0,87 

GR 

ID38 

S 

68 

61,8 

152,0 

26,7 

sobrepeso 

82 

93 

0,88 

GR 

ID39 

S 

71 

64,3 

150,0 

28,6 

sobrepeso 

78 

89 

0,88 

GR 

ID40 

s 

72 

59,2 

153,0 

25,3 

sobrepeso 

73 

82 

0,89 

GR 

ID4I 

A 

69 

63,4 

163,0 

23,9 

normal 

93 

120 

0,78 

MR 

ID42 

S 

68 

66,0 

160,0 

25,8 

sobrepeso 

90 

1 17 

0,77 

PR 

ID43 

Ç 

D 

68 

61,7 

158,0 

24,7 

normal 

90 

1 16 

0,78 

MR 

ID44 

Ç 

D 

73 

68,2 

155,0 

28,4 

sobrepeso 

107 

120 

0,89 

GR 

ID45_ 

S 

79 1 60,1 

160,0 

23,5 

normal 

92 

1 10 

0,84 

MR 
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Neste exemplo cada observação (ou indivíduo) é uma mulher acima de 60 anos, e as 
variáveis (ou características) são: 

- Categoria, sendo A = ativa e S = sedentária 

- Idade, em anos 

- Peso, medido em kg 

- Altura, medida em cm 

- índice de Massa Corporal (IMC), que é a seguinte razão: peso / (altura em metros) 2 

- Classe segundo o IMC: normal ou sobrepeso 

- Circunferência da cintura, medida em cm 

- Circunferência do quadril, medida em cm 

- Relação cintura/quadril (RCQ), adimensional 

- Classe segundo a RCQ, sendo PR = pequeno risco, MR = médio risco e GR = grande 
risco. 

A primeira coluna mostra apenas um código de identificação de cada idosa. 

Neste exemplo temos: 

- 1 variável qualitativa nominal: categoria 

- 2 variáveis qualitativas ordinais: classe IMC e classe RCQ 

- 1 variável quantitativa discreta: idade 

- 6 variáveis quantitativas contínuas: peso, altura, IMC, cintura, quadril e RCQ 

OBSERVAÇÃO: Apesar de Idade ser uma contagem de tempo e o tempo ser algo eminente¬ 
mente contínuo (o tempo não pára...), aqui estamos considerando a idade em anos, que é a 
“parte inteira do tempo de vida". Por isso a Idade foi considerada como uma variável do tipo 
discreta. 


1.4 DISTRIBUIÇÕES DE FREQÜÊNCIAS - TABELAS E GRÁFICOS 

Para melhor descrever o comportamento de uma variável é comum apresentar os va¬ 
lores que ela assume organizados sob a forma de tabelas de freqüências e gráficos. 

Na construção de tabelas de freqüência e gráficos, as variáveis são tratadas de forma 
diferente de acordo com o tipo, conforme veremos nas seções a seguir. 

1.4.1 Tabelas de Freqüências para Variáveis Qualitativas 

Em uma tabela de freqüências para uma variável qualitativa: 

• cada linha corresponde a um valor possível da variável; 

• através de um processo de contagem são obtidos os valores que constam na coluna de 
freqüências da tabela. O resultado dessa contagem é a chamada freqüência absoluta; 

• a partir das freqüências absolutas podem ser também calculadas freqüências rela¬ 
tivas, usualmente apresentadas sob a forma de percentuais. 

EXEMPLO 1.3: Categoria e classe da relação cintura-quadril 

As tabelas de freqüências para as variáveis Categoria e Classe RCQ do Exemplo 1.2 
são as seguintes: 
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TABELA 1.3 Freqüência e percentual das 45 idosas, segundo a categoria 


Categoria 

Freqüência 

Percentuais 

Ativa 

22 

48,89 

Sedentária 

23 

51,1 1 

Total 

45 

100,00 


TABELA 1.4 Freqüência e percentual das 45 idosas, segundo a classe de RCQ 


Classe RCQ 

Freqüência 

Percentuais 

Pequeno Risco 

5 

1 1,1 1 

Médio Risco 

20 

44,44 

Grande Risco 

20 

44,44 

Total 

45 

100,00 


OBSERVAÇÃO: Quando a variável é qualitativa ordinal, as linhas devem seguir a ordem dos 
valores possíveis da variável. 

1.4.2 Gráficos de Barras e Gráficos de Setores para Variáveis 
Qualitativas 

Com base em uma tabela de frequências podem ser construídos gráficos da distribui¬ 
ção de freqüências, entre os quais os mais comuns são o gráfico de barras e o gráfico de 
setores (popularmente conhecido como gráfico de pizza ou de torta). 

No gráfico de barras, as categorias são representadas por retângulos dispostos ao 
longo de um eixo (em geral, o horizontal), e as freqüências ou percentagens, corres¬ 
pondentes a cada categoria, são as alturas desses retângulos com relação ao outro eixo 
(em geral o vertical). 

Já no gráfico de setores, os 360 graus do círculo são divididos em vários setores (fatias) 
proporcionalmente ao percentual de cada categoria. 

EXEMPLO 1.4: Categoria e classe da relação cintura-quadril (cont.) 

A partir das Tabelas 1.3 e 1.4 foram construídos os gráficos de barras da Figura 1.1 e 
os gráficos de setores da Figura 1.2. 
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FIGURA l.l Gráficos de barras, correspondentes aos percentuais de idosas, 
segundo a categoria e a classe RCQ. 
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Sedentária (51,11%) 

Categoria 



GR (44,44%) 
Classe RCQ 


MR 


( 11 . 11 %) 


Figura 1.2 Gráficos de setores, correspondentes aos percentuais de idosas, 
segundo a categoria e a classe RCQ. 


EXERCITANDO: Construa a tabela de frequências, o gráfico de barras e o gráfico de se¬ 
tores para a variável classe IMC. 


EXEMPLO 1.5: O problema mais grave do estado do Rio de Janeiro 

Consideremos agora uma pesquisa por amostragem feita em 1986 junto à população 
do Estado do Rio de Janeiro. Foram ouvidas 1.230 pessoas que, entre outras coisas, 
apontaram qual era, na sua opinião, o problema mais grave do Estado naquele momen¬ 
to. Com base nos dados brutos, foi obtida a tabela a seguir. 

TABELA 1.5 Freqüências e percentuais dos 1.230 respondentes da pesquisa junto à 
população do Estado do Rio de Janeiro em 1986, segundo o problema mais grave do Estado 


Problema mais grave do Estado 

Freqüências 

Percentuais 

Segurança / Violência 

360 

29,27 

Educação 

160 

13,01 

Saúde 

152 

12,36 

Saneamento 

1 18 

9,59 

Alimentação/Fome/Pobreza 

73 

5,93 

Transporte 

63 

5,12 

Outros 

304 

24,72 

Total 

1230 

100,00 


Fonte: Pesquisa de Opinião sobre as Eleições do Rio de Janeiro 1986. IBASE / SERPRO / IM-UFRJ. 


Foram construídos o gráfico de barras na Figura 1.3 e o gráfico de setores (ou gráfico 
“pizza”) na Figura 1.4. 
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Segur Educ Saúde Saneam Fome Transp Outros 


Fonte: Pesquisa de Opinião sobre as Eleições do Rio de Janeiro 1986. IBASE / SERPRO/IM-UFRJ. 

FIGURA 1.3 Gráfico de barras dos percentuais de respondentes 
da pesquisa sobre o “problema mais grave do Estado”. 



Educ (13,01%) 


Segur (29,27%) 


Saneam (9,59%) 


Fome (5,93%) --Outros (24,72%) 

Fonte: Pesquisa de Opinião sobre as Eleições do Rio de Janeiro, 1986. BASE / SERPRO / IM-UFRJ. 

FIGURA 1.4 Gráfico de setores correspondente dos percentuais 
de respondentes da pesquisa sobre o “problema mais grave do Estado”. 


Saúde (12,36%) 


Transp (5,12%) 


OBSERVAÇÕES SOBRE CADA TIPO DE GRÁFICO: 

• O gráfico de setores, por não implicar uma ordenação das categorias, é mais apropria¬ 
do para as variáveis qualitativas nominais (como a que foi considerada no exemplo an¬ 
terior). Enquanto isso, o gráfico de barras, em que as categorias estão naturalmente 
ordenadas, é mais apropriado para as variáveis qualitativas ordinais. 

• Para representar a distribuição de frequências de uma variável através de um gráfico 
de seLores é importante que a variável não possua muitas categorias, pois isso dificulta a 
visualização das proporções. 


1.4.3 Tabelas de Freqüências para Variáveis Quantitativas 

No caso de variável quantitativa discreta com um pequeno número de valores possí¬ 
veis (por exemplo: número de filhos), a construção de uma tabela de freqüência segue 
os mesmos moldes do que loi visto para variáveis qualitativas. 

Quando trabalhamos com uma variável quantitativa discreta com um grande nume¬ 
ro de valores possíveis ou com uma vai iável quantitativa contínua, para avaliarmos sua 
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distribuição através de uma tabela de licqmiu ias, anlcs clt mais nada e pre< iso dividir 
o seu intervalo de variação em vários subimervalos (de prelerèru ia lodos eles com a 
mesma amplitude). Ao adotar esse procedimento, o problema se lorna muito semi 
lhante ao caso de variáveis qualitativas. 

EXEMPLO 1.6: Idade e índice de massa corporal 

Voltemos então à Tabela 1.2 de dados brutos. Foi visto que neste exemplo lemos 
uma variável discreta com muitos valores possíveis (idade em anos) e seis variáveis 
quantitativas contínuas. Vamos construir a tabela de frequências para as variáveis Ida¬ 
de e índice de Massa Corporal. 

No caso da variável Idade, o menor valor é 60, e o maior é 79. Portanto, vamos dividir 
o intervalo [60, 80], que contém todos os valores observados da variável considerada, 
em subintervalos de amplitude 5 (fechados à esquerda e abertos à direita) e contar o nú¬ 
mero de ocorrências em cada um deles, como na Tabela 1.6. 


TABELA 1.6 Freqüências e percentuais das 
faixas etárias para o grupo de idosas 


Faixa Etária 

Frequência 

Percentuais 

60 |— 65 

16 

35,56 

65 |— 70 

16 

35,56 

70 |— 75 

12 

26,67 

75 |— 80 

1 

2,22 

Total 

45 

100,00 


Para a variável 1MC, o menor valor é 20,3, e o maior é 30,1. Portanto, vamos dividir o 
intervalo [20,0 ; 32,5], que contém todos os valores observados da variável considera¬ 
da, em subintervalos de amplitude 2,5 (fechados à esquerda e abertos à direita) e contar 
o número de ocorrências em cada um deles, como na Tabela 1.7. 


TABELA 1.7 Freqüências e percentuais das faixas 
de IMC para o grupo de idosas 


IMC 

Freqüência 

Percentuais 

20,0 |— 22,5 

7 

15,56 

22,5 1— 25,0 

20 

44,44 

25,0 |— 27,5 

1 1 

24,44 

27,5 |— 30,0 

5 

1 1,1 1 

30,0 1— 32,5 

2 

4,44 

Total 

45 

100,00 


EXERCITANDO: Construa uma tabela de freqüências para a variável Relação Cintu¬ 
ra-quadril. ■ 


EXEMPLO 1.7: Telefonia fixa per capita 

A Tabela 1.8 de dados brutos reporta o número de linhas telefônicas por mil habitan¬ 
tes em cada estado do Brasil, em 2001. 
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TABELA 1.8 Telefonia fixa per capita em cada estado do Brasil em 2001 
(em linhas telefônicas por 1.000 habitantes) 


Acre 

183,8 

Maranhão 

86.1 

Rio de Janeiro 

347,5 

Alagoas 

125,4 

M. Grosso 

199,6 

R. G. Norte 

150,1 

Amapá 

193,3 

M. G. Sul 

235,3 

R. G. Sul 

236,9 

Amazonas 

162,0 

M. Gerais 

218,6 

Rondônia 

214,6 

Bahia 

142,3 

Pará 

128,0 

Roraima 

214,1 

Ceará 

140,6 

Paraíba 

125,4 

S. Catarina 

257,3 

D. Federal 

456,8 

Paraná 

244,2 

S. Paulo 

362,8 

E.S. 

228,7 

Pernambuco 

147,8 

Sergipe 

140,7 

Goiás 

231,4 

Piauí 

1 18,2 

Tocantins 

1 13,8 


Fonte: Almanaque Abril 2002. 


No que se refere ao exemplo aqui considerado, o menor valor é 86 (MA), e o maior 
valor é 457 (DF). Portanto, vamos dividir o intervalo [50;500], que contém todos os va¬ 
lores observados da variável considerada, em subintervalos de amplitude 50 (fechados 
à esquerda e abertos à direita) e contar o número de ocorrências em cada um deles, 
como na Tabela 1.9. 


TABELA 1.9 Tabela de freqüências para a telefonia fixa per capita 
em 2001 (em linhas telefônicas por 1.000 habitantes) 


Classe 

Freqüência 

Percentual 

50 |— 100 

1 

3,70 

100 1— 150 

9 

33,33 

150 |— 200 

5 

18,52 

200 |— 250 

8 

29,63 

250 |— 300 

1 

3,70 

300 |— 350 

1 

3,70 

350 |— 400 

1 

3,70 

400 |— 450 

0 

0,00 

450 |— 500 

1 

3,70 

Total 

27 

100,00 


Fonte: Almanaque Abril 2002. 


1.4.4 Histogramas e Diagramas Ramo-Folha para Variáveis Quantitativas 

De forma similar ao gráfico de barras, no histograma os intervalos de classe da variá¬ 
vel considerada são marcados em um eixo e as freqüências (ou percentuais) no outro 
eixo. Se os intervalos estiverem no eixo horizontal e as freqüências no eixo vertical, di¬ 
zemos que é um histograma vertical, caso contrário, o histograma será denominado ho¬ 
rizontal. 

No caso, por exemplo, de um histograma vertical, a largura das barras é proporcional à 
amplitude do intervalo, e a altura é proporcional à freqüência (ou ao percentual). Qual¬ 
quer que st ja o histograma, vertical ou horizontal, não existe espaço entre as barras. 
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EXEMPLO 1.8: Idade e índice de massa corporal (cont.) 

A panir das Tabelas 1.6 e 1.7, podem ser construídos os gráficos da Figura 1.3, a sa¬ 
ber, os histogramas das variáveis Idade e 1MC consideradas no exemplo com os dados 
antropométricos. 
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FIGURA 1.5 Histogramas das variáveis Idade e índice de Massa Corporal (IMC) 


Um outro gráfico que também costuma ser utilizado para tratar o caso de uma variá¬ 
vel quantitativa é o gráfico ramo-folha, cuja construção é feita através de uma seqüên- 
cia de passos a serem percorridos, como no exemplo a seguir. 


EXEMPLO 1.9: Novamente a idade 

Consideremos a variável Idade do exemplo anterior. 

Para obter o gráfico ramo-folha: 

a) O primeiro passo é escolher os ramos a partir dos quais serão colocadas as fo¬ 
lhas. O primeiro ramo corresponderá a todos os valores entre 60 e 64, o segundo 
a todos os valores entre 65 e 69, o terceiro a todos os valores entre 70 e 74, e as¬ 
sim por diante. 

6 

6 

7 

7 

8 

FIGURA 1.6 Ramos (dezenas) a serem usados na 
construção do gráfico ramo-folha da idade 

b) Em seguida, localizaremos cada observação como uma folha (no caso igual ao 
número da unidade) no ramo correspondente. Assim, por exemplo, a idade de 
61 anos será representada pela folha 1 no primeiro ramo 6, a idade de 69 anos 
pela folha 9 no segundo ramo 6, e assim por diante. 

c) Por último, ordenamos crescentemente as folhas dentro de cada ramo. 


O resultado obtido está na Figura 1.7. 
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Ramos 


Folhas 


6 

6 

7 

7 

8 


0011333333334444 

6666778888999999 

011111222233 

9 


Freqüências 

16 

16 

12 

1 

0 


FIGURA 1.7 Gráfico ramo-folha para a Idade. 


EXEMPLO 1. 10: Novamente telefonia fixa per capita 

Voltemos agora ao conjunto de dados sobre o número de linhas telefônicas por mil 
habitantes em cada estado do Brasil, que consta na Tabela 1.8 de dados brutos. 

A partir da Tabela de Freqüências 1.9 pode ser construído o gráfico da Figura 1.8, o 
Histograma da variável número de linhas telefônicas por mil habitantes ali considerada. 



N. linhas/1 .OOOhab. 

Fonte: Almanaque Abril 2002. 

FIGURA 1.8 Histograma do número de linhas telefônicas por 1.000 habitantes. 


Passemos agora ao ramo-folha. 

a) O primeiro passo é escolher os ramos a partir dos quais serão colocadas as fo¬ 
lhas. Neste caso podemos usar centenas, como na Figura 1.9. 
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5 

FIGURA 1.9 Ramos (centenas) a serem usados na construção do gráfico ramo-folha 
para o número de linhas telefônicas por 1.000 habitantes em cada estado do Brasil. 
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O primeiro ramo corresponderá a todos os valores entre 0 e 99, o segundo a to¬ 
dos os valores entre 100 e 199, e assim por diante. 

b) Em seguida, desprezando a unidade e a primeira casa decimal, localizaremos 
cada observação como uma folha (no caso, igual ao número de dezenasj no 
ramo correspondente. Assim, por exemplo, o Acre será representado pela folha 
8 no ramo 1, Alagoas pela folha 2 no ramo 1, o Amapá pela folha 9 no ramo 1 etc. 

c) Por último, ordenamos crescentemente as folhas dentro de cada ramo. 

O resultado obtido está na Figura 1.10. 

Frequência Absoluta 

8 1 

11222444456899 14 

111233345 9 

46 2 

5 1 

0 

Fonte: Almanaque Abril 2002. 

FIGURA 1. 10 Gráfico ramo-folha para o número de linhas 
telefônicas por 1.000 habitantes em cada estado do Brasil. 
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OBSERVAÇÃO SOBRE HISTOGRAMA E RAMO-FOLHA: 

Se a forma de dividir o intervalo de valores em subintervalos e a maneira de escolher os 
ramos forem as mesmas (ou equivalentes), o gráfico ramo-folha e o histograma são pra¬ 
ticamente a mesma figura. Note que isso aconteceu no caso da variável idade (dados an- 
tropométricos), mas não ocorreu no caso da variável número de linhas telefônicas por 
1.000 habitantes. Entretanto, o ramo-folha é mais informativo porque o valor numéri¬ 
co de cada observação não é totalmente perdido. No caso da idade, toda a informação 
numérica foi preservada, e no caso do número de linhas telefônicas por mil habitantes 
preservaram-se os valores até a dezena. 


1.5 MEDIDAS DE CENTRALIDADE PARA VARIÁVEIS 
QUANTITATIVAS 

Para uma dada variável quantitativa, uma medida de centralidade é um “valor típi¬ 
co” em torno do qual se situam os valores daquela variável. 

Há várias formas de se definir uma medida de centralidade: a média aritmética, a me¬ 
diana e a moda sâo as mais conhecidas entre elas. 


Sejam Xj, x 2 , .... x n os valores observados da variável considerada. 

A média aritmética dos dados é definida por 



Yx, 

X, +x,+...+x n 

v _ i a n 

L—d 1 

i =1 

n 

n 
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Sejam x u) < x (2) < ... < x (n) os mesmos valores que compõem a amostra, porém 
dispostos em ordem crescente. 

A mediana dos dados é 


Mediana (x) = 


valor da observação de posição central, se n é ímpar 

média dos valores das duas observações de posição central, se n é par 


A moda dos dados é aquele valor da amostra que ocorre com maior freqüência. 


Neste livro, será dada uma ênfase maior ao conceito de média e, em segundo lugar, 
ao conceito de mediana. 


EXEMPLO l.l I: Características contínuas do conjunto de idosas 

Retomando o conjunto de dados antropométricos sobre as 45 mulheres com mais de 
60 anos (Tabela 1.2), para a variável Idade: 

. 61+69+...+79 

• A media e x =-= 67,20 anos. 

45 

• Como n = 45 é ímpar, o valor correspondente à observação de posição central é o 
de ordem 23. Então, para se calcular a mediana, o primeiro passo é ordenar as 45 
observações: 

60, 60, 61, 61, 63, ... , 72, 72, 73, 73, 79 

Neste exemplo, a idade mediana é 68 anos. Isso significa que nessa amostra de 45 
mulheres, metade delas tem menos de 68 anos e a outra metade tem mais de 68 
anos. 

• A moda é 63 anos, o valor da idade que ocorre com maior freqüência nessa amos¬ 
tra (a saber, oito vezes). 

A tabela a seguir contém o valor da média e da mediana para algumas das variáveis 
quantitativas desse conjunto de dados: 


TABELA MO Média e mediana das variáveis quantitativas - dados antropométricos 


Variável 

Unidade 

Média 

Mediana 

Idade 

anos 

67,20 

68,00 

Cintura 

cm 

86,36 

82,00 

Quadril 

cm 

103,09 

104,00 

RCQ 

- 

0,84 

0,85 


EXEMPLO 1.12: Telefonia fixa per capita (cont.) 

Voltando ao caso da variável número de linhas telefônicas por 1.000 habitantes nos 
estados do Brasil, a média é 


x - 


J 8 1,8 t 125,4 + .+ I I 3,8 
27 


200.188 linhas lelelõnicas por 1.000 habitantes. 
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Ou seja, aqui o valor 200,188 linhas telefônicas por mil habitantes é a média aritmé¬ 
tica dos 27 valores dessa variável, cada um correspondente a um estado do Brasil Po¬ 
rém, no caso específico deste exemplo cabe um esclarecimento. Sabemos que cada um 
dos valores individuais da variável considerada já foi calculado como um quociente en¬ 
tre 1.000 vezes o número de linhas telefônicas e a população do estado. Sendo assim, 
para calcularmos um índice nacional do número de linhas telefônicas por mil habitan¬ 
tes, o mais natural seria dividirmos mil vezes o número total de linhas telefônicas em 
todo o Brasil pela população total do país. Essa forma de calcular certamente nos levaria 
a um resultado diferente, a saber, 238,810 linhas telefônicas por mil habitantes. 

Calculemos agora a mediana. 

Como n = 27 é ímpar, a mediana neste caso é a observação de ordem 14 na amostra 
ordenada, a saber, Mediana(x) = 193,3 linhas telefônicas por 1.000 habitantes. Pode¬ 
mos, portanto, afirmar que, no ano de 2001, em metade dos estados do Brasil havia me¬ 
nos de 193,3 linhas telefônicas por 1.000 habitantes, e na outra metade havia mais de 
193,3 linhas telefônicas por 1.000 habitantes. ■ 

EXEMPLO 1.13: Imóveis à venda ( cont .) 

Considere agora o exemplo dos dados da Tabela 1.1. A moda da variável número de 
quartos é igual a 2, o valor mais freqüente. ■ 


1.6 MEDIDAS DE DISPERSÃO PARA VARIÁVEIS QUANTITATIVAS 

Uma medida de dispersão para uma variável quantitativa é um indicador do grau de 
espalhamento dos valores da amostra em torno da medida de centralidade. 

EXEMPLO 1.14: O que é a dispersão de uma variável quantitativa? 

Vamos comparar os seguintes conjuntos de dados: 


TABELA l.l I Quatro conjuntos de dados hipotéticos 


Conjunto 1: 

4 

4 

4 

10 

16 

16 

16 

Conjunto 2: 

4 

6 

8 

10 

12 

14 

16 

Conjunto 3: 

7 

8 

9 

10 

1 1 

12 

13 

Conjunto 4; 

10 

10 

10 

10 

10 

10 

10 



FIGURA l.l I Os conjuntos de dados exibidos graficamente. 
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Pode ser observado que o ponto central dos quatro conjuntos é igual a 10. 
De fato: 


Conjunto 


Conjunto 


Conjunto 


, _ 4 + 4 + 4 + 10 + 16 + 16 + 16 70 

7 7 

_ 4+6+8 + 10 + 12 + 14 + 16 70 lrt 

7 7 

_ 7+8+9 + 10 + 11 + 12 + 13 70 

7 7 


^ . . _ 10 + 10 + 10 + 10 + 10 + 10 + 10 
Conjunto 4 —> x =- 



Observa-se também que: 

• todas as observações do conjunto 4 são exatamente iguais ao ponto central; 

• no conjunto 3 os dados estão um pouco mais dispersos em relação a 10; 

• no conjunto 2, mais ainda; 

• finalmente, o conjunto 1 é aquele em que há a maior dispersão em torno da média. 


Há diferentes formas de se medir a dispersão de uma variável quantitativa. Aqui serão 
vistas a variância, o desvio-padrão, o coeficiente de variação e a distância interquartil. 



EXEMPLO 1.15: Calculando a variância 

Cálculo da variância para cada um dos conjuntos do Exemplo 1.14: 

2 (4-10) 2 + (4 - 10) 2 +... + (16 - 10) 2 + (16 - 10) 2 

Conjunto 1 — > S =--—-- 

(-6) 2 + (-6) 2 +... + (6) 2 + (6) 2 6x36 ,, 

-=-= 36 

6 6 


Conjunto 2 —> S 2 = 18,67 
Conjunto 3 —> S 2 = 4,67 

Conjunto 4 —> S 2 = 0 ■ 


O desvio-padrão é a raiz quadrada positiva da variância, ou seja, 

H 

P x '- x) IZ*?--** 

n -1 V n -1 
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EXEMPLO 1.16: Calculando o desvio-padrão 

Cálculo do desvio-padrão para cada um dos conjuntos do Exemplo I 14 

Conjunto 1 -» S = V36 = 6 
Conjunto 2 —» S = V 18,67 = 4,32 
Conjunto 3 — » S = 7 4,67 = 2,16 

Conjunto 4 -> S = VÕ = 0 * 

O coeficiente de variação é o quociente entre o desvio-padrão e a média: 

S 

cv = — 

X 

EXEMPLO 1.17: Mães e seus filhos recém-nascidos 

Os dados a seguir representam o peso em quilograma de cinco mães e de seus respec¬ 
tivos bebês recém-nascidos: 


TABELA 1.12 Pesos de cinco mães e seus respectivos bebês 


Peso da mãe 

52,3 

52,5 

53 

53,5 

54 

Peso do recém-nascido 

2,3 

2,5 

3 

3,5 

4 


TABELA 1.13 Média, variância e desvio-padrão dos pesos das mães e dos bebês 


Variável 

Média 

Variância 

Desvio-padrão 

Peso da mãe 

53,06 

0,493 

0,702 

Peso do recém-nascido 

3,06 

0,493 

0,702 


Pode-se ver que as duas variáveis têm desvios-padrão iguais, embora as médias se¬ 
jam bem diferentes. Sendo assim, para poder evidenciar o fato de que, em termos relati¬ 
vos, o peso do bebê varia muito mais que o peso da mãe, o melhor aqui é adotarmos uma 
medida de dispersão relativa, como o coeficiente de variação: 

Tabela 1.14 Coeficiente de variação dos pesos das mães e dos bebês 


Variável 

Coeficiente de variação 

Peso da mãe 

0,009 

Peso do recém-nascido 

0,161 


PERGUNTA: 

Qual o coeficiente de variação dos quatro conjuntos de dados do Exemplo 1.14? 

Sejam x (1) < x (2) < ... < x (n) os dados dispostos em ordem crescente. 

Já vimos que a mediana é um valor tal que metade dos dados é menor que ele, e me¬ 
tade dos dados é maior que ele. 
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Analogamente, os três quartis são valores que dividem os dados em quatro grupos, 
cada um deles contendo 1/4 do tamanho total da amostra. 


O primeiro quartil Q1 tem 1/4 dos dados abaixo dele e 3/4 dos dados acima dele. 
O terceiro quartil Q3 tem 3/4 dos dados abaixo dele e 1/4 dos dados acima dele. 
O segundo quartil Q2 é a própria mediana. 

A distância interquartil é dada por DIQ = Q3 - Ql. 



EXEMPLO 1.18: Calculando a distância interquartil 

Determinemos agora a distância interquartil para cada um dos conjuntos do Exem¬ 
plo 1.14. 


TABELA 1.15 Cálculo do IIQ para cada um dos conjuntos do Exemplo 1.14 


Conjunto de dados 

Ql 

Q2 

Q3 

DIQ=Q3-QI 

1 

4 

10 

16 

12 

2 

7 

10 

13 

6 

3 

8,5 

10 

1 1,5 

3 

4 

10 

10 

10 

0 


Fica então confirmada a nossa constatação de que a dispersão dos dados vai diminu¬ 
indo do conjunto 1 até o conjunto 4. 


Algumas observações sobre as medidas de dispersão: 

1. Não é difícil observar que quanto mais dispersos estiverem os dados maiores 
tendem a ser a variância S 2 , o desvio-padrão S, o coeficiente de variação cv e a 
distância interquartil DIQ. 

2. A unidade da variância é o quadrado da unidade dos dados. Por exemplo, se os da¬ 
dos forem medidos em metros, a unidade da variância será metro ao quadrado. 
Consequentemente, a unidade do desvio-padrão é a mesma dos dados originais. 

3. Talvez, diante da tarefa de propor uma medida de dispersão, a idéia mais natural 
fosse calcular a média aritmética dos desvios x, - x. Porém é fácil ver que essa 
não seria uma boa idéia, já que essa média aritmética seria sempre nula. 

4. Outra opção de medida de dispersão seria então a média aritmética dos módulos 

Z |x i _x| 

dos desvios, ou seja, —-. Entretanto, ela não é muito usada na prática, 

n 

uma vez que não é tão fácil se estabelecerem as propriedades matemáticas de 
uma medida definida com o uso da função valor absoluto. 

5. A solução para essa questão vem então através do conceito de variância. Ao ele¬ 
varmos ao quadrado previamente os desvios x É - x, no cálculo do somatório li- 
vramo nos do cancelamenlo mencionado antei iormente. A explicação do moti¬ 
vo pelo qual dividimos o somatoi io poi n I e não por n (como seria mais nalu- 
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ral) depende de resultados que so serão vistos mais adiante no (apMulo / I fi 
nalmente, para vollar a unidade original, extraímos a raiz quadrada obtendo o 
desvio-padrão. 

6. A média e o desvio-padrão são possivelmente as duas medidas mais comumente 
utilizadas na prática. Porém, enquanto a média aritmética é uma medida nor¬ 
malmente muito conhecida de todos, o mesmo não acontece com o des¬ 
vio-padrão. Assim sendo, como podemos interpretar a magnitude de um deter 
minado valor de S que tenha sido calculado a partir dos dados? Está grande? Está 
pequeno? O conceito de coeficiente de variação (uma grandeza adimensional, já 
que S e xse expressam na mesma unidade) nos fornece uma forma natural de re¬ 
solver esse “impasse”! 


EXEMPLO 1.19: Dados antropométricos revisitados 

No conjunto de dados antropométricos sobre as 45 mulheres idosas, para a variável 
Idade temos: 


Variância: 


S 2 


(61 2 + 69 2 +...+79 2 ) - 45 x 67,20 2 
45-1 


= 17,48 anos 2 . 


Desvio-padrão: 


S=V 17,48 = 4,18 anos. 

Note que esse é um valor relativamente pequeno para o desvio-padrão (por exemplo, 
quando comparado com a média = 67,20 anos), o que indica que a idade não varia mui¬ 
to entre as pessoas desse grupo. 


Coeficiente de variação: 
4 18 

’ =0,0622 


cv = 


67,20 

Isso quer dizer que o desvio-padrão da Idade corresponde a 6,22% da média dessa 
variável. 


Quartis e distância interquartil: 

Na amostra ordenada, o primeiro quartil é o valor que corresponde à observação de 
posição 1 = 12. Portanto, Q1 = 63 anos. 

O terceiro quartil é o valor da observação de posição —=34. Portanto, Q3 = 71 
anos. ^ 

DIQ = 71 - 63 = 8 anos. 


Isso significa que aproximadamente 50% das mulheres dessa amostra têm suas ida¬ 
des entre 63 e 71 anos. 
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A seguir apresentamos sob a forma de uma tabela os valores da variância, do des¬ 
vio-padrão, do coeficiente de variação e do intervalo interquartil para cada uma das va¬ 
riáveis quantitativas desse conjunto de dados: 


TABELA 1.16 Medidas de dispersão para as variáveis quantitativas - dados antropométricos 


Variável 

Unidade 

Variância 

(unidade 2 ) 

Desvio-padrãc 

Coefic. de variação 
(adimensional) 

Distância 

interquartil 

IDADE 

anos 

17,48 

4,18 

0,0622 

8,00 

PESO 

k 8 

51,16 

7,15 

0,1 192 

8,70 

ALTURA 

cm 

16,01 

4,00 

0,0257 

6,00 

IMC 

kg/m 2 

6,10 

2,47 

0,0999 

3,91 

CINTURA 

cm 

163,64 

12,79 

0,1481 

16,00 

QUADRIL 

cm 

185,08 

13,60 

0,1319 

21,00 

RCQ 

- 

0,00291 

0,0540 

0,0644 

0,073 


EXEMPLO 1.20: Telefonia fixa per capita revisitada 

Voltemos ao exemplo dos dados da Tabela 1.8, sobre o número de linhas telefônicas 
por mil habitantes. Aqui, temos: 


Variância: 


s2 _ (184 -200,19) 2 + (125-200,19) 2 +,..+(114 -200,19) z 

27-1 


= 7129,607 


'"linhas telefônicas 
v 1.000 habitantes 


Desvio-padrão: 


/(184 -200,19) 2 +(125-200,19) 2 +...+(114-200,19) 2 
V 27-1 


linhas telefônicas 

= 84,437 - 

1.000 habitantes 


Coeficiente de variação: 


84,437 

cv =- 

200,19 


= 0,422 


Ou seja, o desvio-padrão do número de linhas telefônicas por mil habitantes repre¬ 
senta pouco menos de 30% da média dessa variável. 


(^uaiiis e distância interquartil: 

A mediana e a observação de ordem 14 na amostra ordenada. O primeiro quartil Q l 
esta a meto caminho enlre as observações de ordem I e 14. 
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Como* ' *^ = 7,5,Qlé a média ariimélica mire x (7) - 140,0 e x, )í( 140,7 

Q1 = 140,05. 

Analogamente, Q3 = Vz [x (20) + x ul) ] = Vz 1231,4 + 235, 3] = 2 33,35. 

linhas telefônicas 


ogo. 


Logo, DIQ = 233,35 - 140,65 = 92,70 


1.000 habitantes 


Isso quer dizer que, no ano de 2001, em cerca de metade dos estados do Brasil o nu¬ 
mero de linhas telefônicas por 1.000 habitantes estava entre 140,65 e 233,35. 


1.7 O CONCEITO DE RESISTÊNCIA DE UMA MEDIDA 

Diz-se que uma medida de centralidade ou de dispersão é resistente quando ela é 
pouco afetada pela presença de observações discrepantes. É claro então que as medidas 
mais resistentes são mais convenientes que as menos resistentes. 

Entre as medidas de centralidade, a média aritmética é bem menos resistente que a 
mediana. 

Por outro lado, entre as medidas de dispersão, o desvio-padrão é bem menos resis¬ 
tente que a distância interquartil. 

EXEMPLO 1.21: Medidas resistentes e medidas não-resistentes 

Consideremos novamente o número de linhas telefônicas por mil habitantes em 
cada estado do Brasil. Basta olhar para o ramo-folha dessa variável para perceber que o 
valor 456,8, correspondente ao Distrito Federal, destoa dos demais. O que, aliás, não 
deve ser surpresa para ninguém! 

Para comprovarmos essas afirmações, vamos eliminar dos dados esse valor, e então 
recalcular os valores das quatro medidas mencionadas anteriormente. 

TABELA 1.17 Número de linhas telefônicas por 1.000 habitantes - Efeito da exclusão de uma 
observação discrepante sobre o cálculo de medidas de centralidade e de dispersão 


Medida 

Amostra Completa 

Amostra Expurgada 

N 2 de observações 

27 

26 

Média 

200,20 

190,33 

Mediana 

193,3 

188,6 

Desvio-padrão 

84,44 

68,41 

Distância Interquartil 

92,7 

90,2 


Como podemos observar, após a exclusão da observação discrepante: 

• A média diminuiu em aproximadamente 10 unidades, enquanto a mediana caiu 
em apenas 5 unidades (metade). 

• O desvio-padrão diminuiu de aproximadamente 16 unidades, enquanto a distân¬ 
cia interquartil caiu em apenas 2,5 unidades (menos de um sexto). 
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Curiosidade : 

Suponha que tivesse havido um erro de digitação de modo que o valor 456,8 correspon¬ 
dente ao Distrito Federal passasse a ser 4568. Verifique qual seria a variação em cada 
uma dessas quatro medidas, sempre comparando a amostra completa com a amostra 
expurgada. Extraia suas conclusões. ■ 


E importante ressaltar que, embora a média seja menos resistente, na prática ela cos¬ 
tuma ser usada muito mais freqüentemente do que a mediana, porque suas proprieda¬ 
des matemáticas são mais facilmente demonstráveis. 

1.8 IDENTIFICAÇÃO DE DISCREPÂNCIAS EM VARIÁVEIS 
QUANTITATIVAS 

Eventualmente em uma massa de dados há valores que foram coletados em condi¬ 
ções anormais (falha de equipamento, queda de energia, erro do operador, erro de leitu¬ 
ra, erro de digitação etc.). Esses valores, principalmente quando estão muito afastados 
dos demais (para mais ou para menos), infelizmente podem afetar de forma substancial 
o resultado das análises estatísticas. São as chamadas observações discrepantes ou 
outliers. Assim sendo, é útil que tenhamos disponível um critério de detecção de obser¬ 
vações discrepantes. Uma vez detectada a presença de uma observação discrepante, po¬ 
derá ser tomada a decisão de repetir aquele experimento, ou meramente expurgar 
aquele dado da amostra (ou até mesmo mantê-lo, se for encontrada uma explicação 
plausível para aquela discrepância... ). 

Um critério bastante utilizado para a identificação de observações discrepantes que 
se baseia em medidas pouco resistentes é apontar toda observação que estiver fora do 
intervalo (x - 3 • S; x + 3 ■ S). 

Um segundo critério também muito usado que se baseia em medidas mais resisten¬ 
tes para a identificação de observações discrepantes é apontar qualquer valor abaixo 

3 3 

da cerca inferior = Q1 — x DIQ ou acima da cerca superior = Q3 + - x DIQ. 

EXEMPLO 1.22: Dados antropométricos - Há discrepâncias? 

No caso do arquivo com dados antropométricos, vamos analisar a eventual presença 
de observações discrepantes no caso das variáveis idade (em anos) e peso (em kg). 

Para usar o primeiro critério, que se baseia em média e desvio-padrão, vamos montar 
a seguinte tabela de resultados: 

TABELA 1.18 Intervalos de não-discrepância baseados em x ± 3S - dados antropométricos 


Variável 

Média (x) 

Desvio-padrão (S) 

x-3S 

x + 3S 

IDADE 

67,2 

4,18 

54,66 

79,74 

PESO 

59,99 

7,15 

38,54 

81,44 

ALTURA 

155,68 

4 

143,68 

167,68 

IMC 

24,72 

2,47 

17,31 

32,13 

Cll JTURA 

86,36 

12,79 

47,99 

124,73 

QUADRIL 

103,09 

13,6 

62,29 

143,89 

R.CQ 

0,84 

0,05 

0,69 

0,99 
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Enquanto isso, para o segundo critério, baseado nosquarlisda variável, montaremos 
esta outra tabela: 

TABELA 1.19 Intervalos de não-discrepância baseados em quartis - dados antropométricos 


Variável 

Ql 

Q3 

D/Q 

Q/-/.5D/Q 

Q3+I.5DIQ 

IDADE 

63 

71 

8 

51 

83 

PESO 

54,7 

63,4 

8,7 

41,65 

76,45 

ALTURA 

152 

158 

6 

143 

167 

IMC 

22,85 

26,76 

3,91 

16,985 

32,625 

CINTURA 

76 

92 

16 

52 

1 16 

QUADRIL 

90 

1 1 1 

21 

58,5 

142,5 

RCQ 

0,8 

0,87 

0,07 

0,695 

0,975 


Os valores ordenados (em cinco colunas) da variável Idade são: 


60 

63 

66 

69 

71 

60 

63 

66 

69 

71 

61 

63 

67 

69 

72 

61 

64 

67 

69 

72 

63 

64 

68 

69 

72 

63 

64 

68 

70 

72 

63 

64 

68 

71 

73 

63 

66 

68 

71 

73 

63 

66 

69 

71 

79 


As conclusões podem ser resumidas na tabela a seguir: 

TABELA 1.20 Identificação dos outliers da variável Idade - dados antropométricos 


Critério 

Cerca Inferior 

Cerco Superior 

Outliers 

x ± 3S 

54,66 

79,74 

Não há 

QI-I.5DIQ, Q3+I.5DIQ 

51 

83 

Não há 


Os valores ordenados (em cinco colunas) da variável Peso são: 


49,8 

53,4 

58,2 

61,3 

65,2 

50 

54,6 

58,2 

61,7 

66 

50,1 

54,7 

58,2 

61,8 

68,2 

51 

55 

58,6 

62 

68,6 

51,3 

55,2 

59,2 

62,7 

70.1 

51,6 

56,2 

59,8 

63 

73,2 

52,1 

56,2 

60 

63,4 

75,6 

52,1 

57,9 

60,1 

64,3 

76,2 

53,2 

58 

60,3 

64,3 

77 


As conclusões podem ser resumidas na tabela a seguir: 
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TABELA 1.2! Identificação dos outliers da variável Peso - dados antropométricos 


Critério 

Cerca Inferior 

Cerca Superior 

Outliers 

X±3S 

38,54 

81,44 

Não há 

QI-I.5DIQ, Q3+I.5DIQ 

41,65 

76,45 

77 



EXEMPLO 1.23: Telefonia fixa per capita - Há discrepâncias? 

Para o número de linhas telefônicas por 1.000 habitantes nos estados do Brasil: 

Como x = 200,19 e S = 84,44, o intervalo x ± 3S é (-53,13; 453,51). 

Então, o valor 456,8 (Distrito Federal) seria discrepante. 

Quanto ao outro critério, temos Ql= 140,6, Q3 = 233,3 e DIQ = 92,7. 

Logo, Q1 -1 x DIQ =1,5 e Q3 + ^ x DIQ = 372,5. 

Novamente aqui o valor correspondente ao Distrito Federal (456,8) seria considera¬ 
do suspeito. ■ 

CONSIDERAÇÕES SOBRE A SIMETRIA DO PERFIL DE FREQÜÊNCIAS: 

a) Convém observar que ambos os critérios aqui apresentados, pela própria forma 
como foram propostos, pressupõem que a distribuição de frequências (repre¬ 
sentada pelo histograma ou pelo gráfico ramo-folha) dos dados é simétrica com 
relação à medida de centralidade adotada (média ou mediana). 

b) Se, para a variável em exame, a distribuição de frequências for muito assimétrica 
(é mais comum o caso de assimetria para a direita), um expediente útil é aplicar 
uma transformação à variável original (por exemplo: raiz quadrada, logaritmo 
etc.) e depois usar o critério para detecção de observações discrepantes para a 
variável já transformada. 

1.9 BOX PLOT PARA VARIÁVEIS QUANTITATIVAS 

O box plot ou desenho esquemático é um gráfico que se costuma utilizar para sinte¬ 
tizar em uma mesma figura várias informações relativas à distribuição de uma determi¬ 
nada variável quantitativa: 

a) Inicialmente é traçado um eixo vertical no qual serão representados os valores 
da variável considerada. 

b) Depois se desenha um retângulo cuja base inferior corresponde à posição do primeiro 
quartil Q1 e cuja base superior corresponde à posição do terceiro quartil Q3. A posi¬ 
ção da mediana é indicada por um traço horizontal no interior desse retângulo. 

c) Em seguida são traçados dois segmentos de reta verticais, em que um deles vai 
desde o ponto médio da base inferior do retângulo até a posição da menor obser¬ 
vação não-discrepante, e o outro vai desde o ponto médio da base superior do re¬ 
tângulo ate a posição da maior observação não-discrepante. 

d; Cada uma das observações discrepantes e explicitada (c, muitas vezes, devida¬ 
mente rotulada) no gráfico. 

Observe que nesta ligura a dimensão horizontal não tem qualquer significado. 
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EXEMPLO 1.24: Idade e índice de massa corporal 



r^- 


o 



o 

CD 



IDADE IMC 

FIGURA 1.12 8 ox plots das variáveis Idade e IMC 
no exemplo com dados antropométricos 


Vemos que, em ambos os casos, o Box plot mostra que existe uma certa simetria na 
distribuição de freqüências da variável considerada (principalmente para o IMC). E 
também que em ambos os casos não há outliers. 


EXEMPLO 1.25: Telefonia fixa per capita 

Já para o exemplo do Número de linhas telefônicas por mil habitantes, temos a situa¬ 
ção exibida na Figura 1.13 a seguir. 



N. linhas/1 OOOhab 


Fonte: Almanaque Abril 2002. 

FIGURA 1.13 Box Plot do Número de linhas telefônicas 
por 1.000 habitantes em cada estado do Brasil. 
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Neste caso já vimos que há uma certa assimetria para a direita na distribuição de fre¬ 
quências da variável Número de linhas telefônicas por 1.000 habitantes. Não é por aca¬ 
so que o outlier apontado (DF) é um valor considerado “anormalmente alto”. Essa 
conclusão possivelmente se modificaria se aplicássemos previamente aos dados uma 
transformação simetrizante. B 



RESUMO DO CAPÍTULO I 

• No estudo de Técnicas Estatísticas os três termos a seguir aparecem com muita 
frequência: 

População - é o conjunto de todos os elementos (pessoas ou objetos) cujas 
propriedades o pesquisador está interessado em estudar. 

Censo - é um levantamento completo sobre uma determinada população, ou 
seja, contemplando cada um dos seus elementos. 

Amostra - é um subconjunto de elementos selecionados da população segundo 
regras bem definidas. É muito importante o uso de técnicas que nos garantam a 
obtenção de amostras representativas da população. 

• Análise Exploratória é um conjunto de técnicas de tratamento de dados que, 
sem implicar uma fundamentação matemática mais rigorosa, nos ajuda a tomar 
um primeiro contato com a informação disponível. 

• Em um levantamento de dados a respeito de um determinado assunto, eles cos¬ 
tumam ser representados em uma tabela de dados brutos. 

• Em uma tabela de dados brutos, cada linha corresponde a uma observação e 
cada coluna corresponde a uma variável. 

• As variáveis podem ser: 

Qualitativa nominal ou categórica - seus valores possíveis são diferentes cate¬ 
gorias não-ordenadas. 

Qualitativa ordinal - seus valores possíveis são diferentes categorias ordenadas. 
Quantitativa discreta - seus valores possíveis são resultados de um processo de 
contagem. 

Quantitativa contínua - seus valores possíveis podem ser expressos através de 
números reais. 

• Para descrever o comportamento de uma variável é comum apresentar os valo¬ 
res que ela assume organizados sob a forma de tabelas de frequência e gráficos. 

• Os gráficos mais comuns para representarem variáveis qualitativas são os gráfi¬ 
cos de barras e os gráficos de setores. Para as variáveis quantitativas, os mais 
usados são os histogramas, os diagramas ramo-folhas e os boxplots. 

• Para uma dada variável quantitativa, uma medida de centralidade é um “valor 
upico em torno do qual se situam os valores daquela variável. 

• As medidas de centralidade mais conhecidas são: a média aritmética, a media¬ 
na e a moda. 

• I Jina medida de dispersão para uma variavel quantitativa e um indicadoí do grau 
di espalhamento dos valores da amostra em toi no da medida de centralidade. 
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• As medidas de dispersão mais conhecidas são: a variância, o desvio-padrão, o 
coeficiente de variação e a distância interquartil. 

• Uma medida de centralidade ou de dispersão é resistente quando ela é pouco 
afetada pela presença de observações discrepantes. 

• Entre as medidas de centralidade, a mediana é mais resistente que a média arit¬ 
mética. Entre as medidas de dispersão, a distância interquartil é mais resisten¬ 
te que o desvio-padrão. 

• Observações discrepantes ou outliers são observações cujos valores estão mui¬ 
to afastados dos demais (para mais ou para menos). Essas observações podem 
afetar de forma substancial o resultado das análises estatísticas. 

• O box plot ou desenho esquemático é um gráfico que se costuma utilizar para 
sintetizar em uma mesma figura várias informações relativas à distribuição de 
uma determinada variável quantitativa. Nele também são representadas as ob¬ 
servações discrepantes. 


EXERCÍCIOS RESOLVIDOS 

1.1_R) Variável mais constante e variável vezes constante 
Considere o conjunto de dados a seguir: 


Obs. 

X 

Y 

Z 

1 

1 

2 

4 

2 

2 

4 

5 

3 

3 

6 

6 

4 

4 

8 

7 

5 

5 

10 

8 


a) Para cada uma das variáveis X, Y, Z, calcule: média, variância, desvio-padrão, 
coeficiente de variação (cv), mediana (Q2), Ql, Q3, DIQ=Q3-Q1. 

b) Faça um gráfico, como o da Figura 1.11, localizando no eixo horizontal (gradua¬ 
do de 1 a 10) as coordenadas dos pontos e no eixo vertical três níveis: X, Y e Z. 
Analise visualmente a relação entre as três variáveis em termos de centralidade e 
dispersão. 

c) Verifique que relação matemática existe entre as variáveis Y e X e faça o mesmo 
com relação às variáveis Z e X. Em seguida, verifique que relação matemática 
existe entre os valores das medidas de centralidade e de dispersão relativas às va¬ 
riáveis Y e Z e as mesmas medidas para X. 

d) Como se poderia generalizar as constatações do item (c) para o caso de variáveis 
do tipo Y = cX e Z = c+X? 

Solução: 

(a) Exemplifiquemos os cálculos para a variável Y: 

_ 2 + 4+6+8 + 10 „ 


Média: 


5 
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Variância: 
Desvio-padrão: 
Coeficiente de variação: 
Mediana: 


l 2 quartil: 

3 2 quartil: 

Distância interquartil: 


c2 _ (2 2 + 4 2 +6 2 +8 2 +10 2 )-5 x6 2 

O y 

5-1 

S Y = VTÕ = 3,16 



0,53 


10 


Dados ordenados: 

Posição: 12 3 

Valor: 2 4 6 

Posição(Q2) = = 3 

Posição(Ql) = ^ + ^ =2 
2 

Posição(Q3) = ^ = 4 

2 

D1Q(Y) = Q3(Y) - Q1(Y) = 


4 5 

8 10 

Q2(Y) = y (3) = 6 

Q1(Y) = y (2) = 4 

Q3(Y) = y (4) = 8 
8-4 = 4 


O procedimento para as outras duas variáveis é análogo. 

A tabela a seguir é um resumo de todos os resultados obtidos: 


Var. 

Média 

Variância 

DPadrão 

Coef. var. 

Q2 

Ql 

Q3 

D/Q 

X 

3 

2,5 

1,58 

0,53 

3 

2 

4 

2 

Y 

6 

10 

3,16 

0,53 

6 

4 

8 

4 

Z 

6 

2,5 

1,58 

0,26 

6 

5 

7 

2 


(b) Gráfico simultâneo das variáveis X, Y e Z: 


♦ 


Y- 


♦ 


Z _ 


♦ 


♦ 


i- 1 -1-1-1-r 

0 2 4 6 8 10 


A figura sugere que: 

• De X para Y tudo dobra, tanto em termos de locação como de dispersão. 

• De X para Z tudo se desloca para a direita 3 unidades. 

(c ) f fácil ver que Y = 2X e Z = 3 + X. 

Além disso, Média(Y) = 6 = 2x3 = 2 Média(X) 

Desvio-padrão (Y) = 3,16 = 2 x 1,58 = 2 DPadrão (X) 
Coei. var.(Y) = 0,51 = Coef. var.(X) 

Mediana(Y) 6 = 2 x 1 = 2 Mediana(X) 

QJ(Y) =4-2x2=2 Ql(X) 

Q1ÍY) H 2xH 2( V )1(X) 

|)I( 4 )ÍV) = H 2x2 = 2 I)l( v )(.\) 
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Isso quer dizer que, quando multiplicamos uma variável |><>r 2 Iodas as medidas 
aqui consideradas lambem ficam multiplicadas por 2, cxr elo a variam ia qm fi< a mui 
tiplicada por 4; e o coeficiente de variação, que permanece inalterado. 

Média(Z) =6=3+3=3+ Média(X) 

Variância(Z) = 2,5 = Variância(X) 

DPadrão (Z) = 1,58 = DPadrão (X) 

1 SH S 

Coef. var.(Z) = 0,26 = — 1 — =—— 

3 + 3 3 + x 

Mediana(Z) = 6 = 3 + 3 = 3 + Mediana(X) 

Q1(Z) = 5 = 3 + 2 = 3 + Q1(X) 

Q3 (Z) = 7 = 3 + 4 = 3 + Q3(X) 

DIQ(Z) = 2 = DIQ(X) 


Isso quer dizer que, quando somamos 3 unidades a uma variável, a média e os 3 quar¬ 
tis (Ql, Q2 e Q3) também aumentam de 3 unidades. Já a variância, o desvio-padrão e a 
DIQ não se alteram. 


d) Se Y = c.X, temos: 


Se Z = c + X: 


Média(Y) = c. Média(X) 
Variância(Y) = c 2 . Variância(X) 
DPadrão (Y) = |c| . DPadrão (X) 
Coef. var.(Y) = Coef. var.(X) 
Mediana(Y) = c.Mediana(X) 
Q1(Y) = c.Ql(X) 

Q3 (Y) = c.Q3(X) 

DIQ(Y) = lcl.DIQ(X) 

Média(Z) = c + Média(X) 
Variância(Z) = Variância(X) 
DPadrão (Z) = DPadrão (X) 


Coef. var.(Z) = 


Coef. var.(X) 


c + x 


£ + i 


Mediana(Z) = c + Mediana(X) 
Q1(Z) = c + Q1(X) 

Q3 (Z) = c + Q3(X) 

DIQ(Z) = DIQ(X) 


1.2_R) Tempo de permanência em hospital - Análise diretamente a partir da distri¬ 
buição de freqüências 

Há determinadas situações em que não se tem acesso aos dados individuais, mas está 
disponível uma distribuição de freqüências da variável de interesse, como na tabela a 
seguir. 
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TABELA - Distribuição de freqüências do tempo de permanência na última internação referente a uma 
amostra de pacientes do Hospital Espírita de Porto Alegre nos quatro primeiros meses de 1996 


Permanência (dias) 

Ponto médio (Xj) 

Freqüência simples (fj) 

0a 10 

5 

70 

10 a 20 

15 

69 

20 a 30 

25 

90 

30 a 40 

35 

43 

40 a 50 

45 

43 

50 a 60 

55 

31 

60 a 70 

65 

16 

70 a 80 

75 

7 

80 a 90 

85 

0 

90 a 100 

95 

1 

Total 


370 


Fonte: Jornal Brasileiro de Psiquiatria - Setembro de 1999. 


Como determinar as medidas de centralidade e de dispersão em uma tal situação? 


Solução: 

Para simplificar, vamos considerar que, para todas as observações que pertencem a 
uma determinada classe (intervalo), o valor da variável é exatamente igual ao ponto 
médio daquele intervalo. 

Portanto, para obter valores aproximados para a média e o desvio-padrão usam-se 
as expressões a seguir: 



onde J é o número total de classes da tabela e 
para cada classe j, j = 1,2,...J, 

í, é a íreqüência absoluta de observações naquela classe 
x l é o ponto médio do intervalo considerado 


No caso do exemplo anterior, temos então 


70 x 5 + 69 x 15+...+1 x 95 _ _ 

x =-= 28,22 dias 

370 


S = 


, , *. (70x5 + 69x 15+...+ 1 x95) 2 

(70 x 5 -» 69 x 15 2 + ... + 1 x 95 2 ) - 

_ 570 


169 


18,66 dias 
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Quanlo à determinação da mediana e da distância interquartil, recomenda-se com¬ 
plementar a tabela original com mais algumas colunas, conforme esta sequência de 
passos: 

i. Construir a partir dos dados uma coluna com as freqüências absolutas acumula¬ 
das. Por exemplo: 139 = 70 + 69; 229 = 139 + 90 etc. 

ii. Construir a partir dos dados uma coluna com as freqüências relativas acumula¬ 
das V:. Por exemplo: 0,189 = 0,376 = etc. 

J 370 370 

iii. Montar a tabela a seguir: 


TABELA - Cálculos necessários para a determinação da 
mediana e dos quartis do tempo de permanência 


N° da classe 

Classe de Permanência 
(dias) 

Freq. abs. 
simples 

Freq. abs. 
Acumulada 

Freq. Rei. 
Acumulada 

1 

0a 10 

70 

70 

0,189 

2 

10 a 20 

69 

139 

0,376 

3 

20 a 30 

90 

229 

0,619 

4 

30 a 40 

43 

272 

0,735 

5 

40 a 50 

43 

315 

0,851 

6 

50 a 60 

31 

346 

0,935 

7 

60 a 70 

16 

362 

0,978 

8 

70 a 80 

7 

369 

0,997 

9 

80 a 90 

0 

369 

0,997 

10 

90 a 100 

1 

370 

1,000 


Isso quer dizer que: 

• 18,9% dos tempos de permanência são menores que 10 dias; 

• 37,6% dos tempos de permanência são menores que 20 dias. 

• 61,9% dos tempos de permanência são menores que 30 dias. 

• 73,5% dos tempos de permanência são menores que 40 dias. 

• 85,1% dos tempos de permanência são menores que 50 dias. 

• 93,5% dos tempos de permanência são menores que 60 dias. 

• 97,8% dos tempos de permanência são menores que 70 dias. 

• 99,7% dos tempos de permanência são menores que 80 dias. 

• 100,0% dos tempos de permanência são menores que 100 dias. 

iv. Determinação do 1^ quartil Q1 

Sabemos que l /4 (ou 25%) das observações deve estar abaixo de Ql. 
Então, os 25% menores tempos de permanência devem ser inferiores a Ql, 
ou seja, a freqüência relativa acumulada correspondente a Ql tem de ser 
igual a 0,25. 

Como 0,189 < 0,25 < 0,376, isso implica que necessariamente Ql está entre 
10 e 20 dias. A figura a seguir então nos mostra como podemos calcular o valor 
de Ql através de uma regra de três: 
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Ql-10 20-10 

-=-. Então, 

0,25-0,189 0,376-0,189 


10 

X -L 


Q1 20 


Ql = 10 + (2 °- 10)x(0 - 25 -0- 189 ) = 13,26 
0,376-0,189 


Fr | 
0,189 


0,25 0,376 


v. Determinação do 2^ quartil Q2 (mediana) 

Sabemos que 1/2 (ou 50%) das observações deve estar abaixo de Q2. Então, 
os 50% menores tempos de permanência devem ser inferiores a Q2, ou seja, a 
freqüência relativa acumulada correspondente a Q2 tem de ser igual a 0,50. 

Como 0,376 < 0,50 < 0,619, isso implica que necessariamente Q2 está entre 
20 e 30 dias. Analogamente, podemos escrever também: 

Q2 = 20 + (30 - 20) x (0,50-0,376) _ 

0,619-0,376 


vi. Determinação do 3 o quartil Q3 

Sabemos que 3/4 (ou 75%) das observações devem estar abaixo de Q3. Então, 
os 75% menores tempos de permanência devem ser inferiores a Q3, ou seja, a 
freqüência relativa acumulada correspondente a Q3 tem de ser igual a 0,75. 

Como 0,735 < 0,75 < 0,851, isso implica que necessariamente Q3 está entre 
40 e 50 dias. Analogamente, podemos escrever também: 

0 + (50 - 40) x (0,75 - 0,735) _ 

0,851-0,735 

Logo, Mediana = 25,14 dias e DIQ = 41,29 - 13,26 = 28,03 dias. 


1.3_R) Consumo de proteínas em países europeus 

Obs.: Este exercício foi resolvido com o uso do computador. 

A tabela a seguir contém para cada um de vários países da Europa, estimativas do 
consumo diário de proteína em gramas per capita por tipo de alimento. 


TABELA - Consumo diário de proteína (em gramas per capita ) 
para países europeus, por tipo de alimento 


País 

Carne 

Porco e 

aves 

Ovos 

Leite 

Peixe 

Cereais 

Amido 

Nozes 

Frutas e 
vegeta/s 

Albânia 

10,1 

1,4 

0,5 

8,9 

0,2 

42,3 

0,6 

5,5 

1,7 

Áustria 

8,9 

14,0 

4,3 

19,9 

2,1 

28,0 

3,6 

1,3 

4,3 

Bélgica/Luxemb. 

13,5 

9,3 

4,1 

17,5 

4,5 

26,6 

5,7 

2.1 

4,0 

Bulgária 

7,8 

6,0 

1,6 

8,3 

1,2 

56,7 

1,1 

3,7 

4,2 

Tchecoslováquia 

9,7 

1 1.4 

2,8 

12,5 

2,0 

34,3 

5,0 

1.1 

4,0 

Dinamarca 

10,6 

10,8 

3,7 

25,0 

9,9 

21,9 

4,8 

0,7 

2,4 

Alern. Oriental 

84 

11,6 

3,7 

í 1,1 

5,4 

24,6 

6.5 

0,8 

3,6 

Finlândia 

9,5 

4,9 

2,7 

33,7 

5,8 

26,3 

5,1 

1,0 

1,4 
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País 

Carne 

Porco e 

oves 

Ovos 

Leite 

Peixe 

Cereais 

Amido 

No/e s 

Frutas e 
vegetais 

França 

18,0 

9,9 

3,3 

19,5 

5,7 

28,1 

4,8 

2.4 

6,5 _ 

Grécia 

10,2 

3,0 

2,8 

17,6 

5,9 

41,/ 

2,2 

7,8 

6,5 

Hungria 

5,3 

12,4 

2,9 

9,7 

0,3 

40,1 

4,0 

5,4 

4,2 

Irlanda 

13,9 

10,0 

4,7 

25,8 

2,2 

24,0 

6.2 

1,6 

2,9 

Itália 

9,0 

5.1 

2,9 

13,7 

3.4 

36,8 

2,1 

4,3 

6,7 

Holanda 

9,5 

13,6 

3,6 

23,4 

2,5 

22,4 

4,2 

1.8 

3,7 

Noruega 

9,4 

4,7 

2,7 

23,3 

9,7 

23,0 

4,6 

1,6 

2.7 

Polônia 

6,9 

10,2 

2,7 

19,3 

3,0 

36,1 

5,9 

2,0 

6,6 

Portugal 

6,2 

3,7 

1,1 

4,9 

14,2 

27,0 

5,9 

4,7 

7,9 

Romênia 

6,2 

6,3 

1,5 

11,1 

1,0 

49,6 

3,1 

5,3 

2,8 

Espanha 

7,1 

3,4 

3,1 

8,6 

7,0 

29,2 

5,7 

5,9 

7.2 

Suécia 

9,9 

7,8 

3,5 

24,7 

7,5 

19,5 

3,7 

1,4 

2,0 

Suíça 

13,1 

10,1 

3,1 

23,8 

2,3 

25,6 

2,8 

2,4 

4,9 

Reino Unido 

17,4 

5,7 

4,7 

20,6 

4,3 

24,3 

4,7 

3.4 

3,3 

Rússia 

9,3 

4,6 

2,1 

16,6 

3,0 

43,6 

6,4 

3,4 

2,9 

Alem. Ocidental 

1 1,4 

12,5 

4,1 

18,8 

3,4 

18,6 

5,2 

1,5 

3.8 

Iugoslávia 

4,4 

5,0 

1,2 

9,5 

0,6 

55,9 

3,0 

5,7 

3,2 


Fonte: Bases de dados do software Statistica. 


a) Determine, para cada uma das nove variáveis anteriores: a média, a mediana, o 
desvio-padrão, o 1- quartil, o 3 2 quartil, a distância interquartil, o coeficiente de 
variação usual (cvl) e o quociente entre a distância interquartil e a mediana 
(cv2). 

b) Faça um box plot simultâneo para todas as variáveis e extraia conclusões. 

Solução: 

(a) Usando os comandos do Excel é imediata a determinação de cada um desses valores. 

Eles constam na tabela a seguir: 


TABELA - Medidas de centralidade e de dispersão do consumo diário de proteína 
(em gramas per capita ) para países europeus, por tipo de alimento 


Medida 

Carne 

Porco e 

aves 

Ovos 

Leite 

Peixe 

Cereais 

Amido 

Nozes 

Frutas e 
Vegetais 

Média 

9,8 

7,9 

2,9 

17,1 

4,3 

32,2 

4,3 

3,1 

4,1 

Mediana 

9,5 

7,8 

2,9 

17,6 

3,4 

28,0 

4,7 

2,4 

3,8 

Desvio-padrão 

3,347 

3,694 

1,1 18 

7,105 

3,403 

10,975 

1,634 

1,986 

1,804 

Ql 

7,8 

4,9 

2,7 

1 U 

2,1 

24,3 

3,1 

1,5 

2,9 

Q3 

10,6 

10,8 

3,7 

23,3 

5,8 

40,1 

5,7 

4,7 

4.9 

DIQ 

2,8 

5,9 

1 

12,2 

3,7 

15,8 

2,6 

3.2 

2 

cvl 

0,341 

0,468 

0,381 

0,415 

0,794 

0,340 

0,382 

0,646 

0,436 

cv2 

0,295 

0,756 

0,345 

0,693 

1,088 

0,564 

0,553 

1,333 

0,526 
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(b) 



O gráfico anterior mostra que o consumo diário de proteínas per capita é feito princi¬ 
palmente através de cereais, seguido do leite. Esses dois itens dominam o cenário, tanto 
em termos de valor central como em termos de variabilidade. 


EXERCÍCIOS PROPOSTOS 

1.1_P) Imóveis anunciados para venda 

Usando os dados da Tabela 1.1 obtenha: 

a) um gráfico de barras para a variável Tipo de Imóvel. 

b) um ramo-folha e um box plot para a variável Preço. 

I 2_P) O impacto da mudança de um único valor sobre a média e sobre a mediana 

Suponha que estávamos trabalhando com um conjunto de n observações relativas a 
uma determinada variável quantitativa, onde n > 2. Foram calculadas a média aritméti¬ 
ca e a mediana desses dados. Em seguida, o valor da maior entre todas essas n observa¬ 
ções sofreu um aumento. 

Como resultado disso: 

a ) I anlo a media quanto a mediana aumentam? 

b) I anlo a média quanto a mediana não se alteram? 
t) A média nao st altera e a mediana aumenta? 

d) A media aumenta e a mediana nao sc altera? 
ej Nada st' pode aliimai sobie a mudança na mediana? 
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1.3_P) Notas de uma prova 

As notas obtidas pelos alunos de uma turma em determinada prova estão apresenta¬ 
das no gráfico ramo-folha a seguir (ramo = parte inteira e folha = parte decimal da nota): 


0 

1 

2 

3 

4 

5 

6 

7 

8 
9 


2 


26 

13556 

1355678 

112334456899 

0111233345 

8 


a) Quantos alunos tem a turma? Quantos obtiveram notas acima de 6? E abaixo de 4? 

b) Calcular mediana, Q1 e Q3. 

c) Construir um box plot. 


1.4_P) Conteúdo de proteínas nos alimentos 

A tabela a seguir contém, para cada alimento de uma amostra de 19 alimentos, o va¬ 
lor da variável Conteúdo de Proteínas (em g). 

Amostra com 19 alimentos e seu conteúdo de proteínas (g) 


Alimento 

Proteínas 

Alimento 

Proteínas 

Bife, sem gordura 

32,6 

Azeitona 

0 

Molho(vegetais) 

2 

Ervilha em lata 

6 

Pirulito Amendoim 

0 

Ameixa 

0,5 

Cobert. queijo parm./alho 

2 

Arroz branco 

3 

Tempero apimentado(lata) 

18 

Salmão defumado 

20,7 

Milho em lata 

2,7 

Sopa de arroz e galinha 

3 

Caramelo dinamarquês 

3 

Morango (em xarope) 

0 

Pimenta com alho 

0,3 

Peito de peru 

248,1 

Sorvete de morango 

1 

Iogurte de pêssego 

8 

Entr.: Macarrão queijo 

13 




Fonte: "The Complete Book of Food Counts", C. Netzer, Dell Publishing, 1997. 


a) Faça um gráfico ramo-folha para esses dados. (Sugestão: Use ramo = n° de de¬ 
zenas). 

b) Determine a mediana e o intervalo interquartil. 

c) Aponte as observações discrepantes, usando o critério que se baseia em medidas 
resistentes. 

d) Qual seria uma possível explicação para o fato surpreendente de que o conteúdo 
de proteínas relativo ao peito de peru seja tão alto neste caso? 

1.5_P) Produtividade de plantações de feijão 

A tabela a seguir fornece a produtividade das plantações de feijão (em quilos por hec¬ 
tare) nos diversos estados do Brasil em 1980. 
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Estado 

Produtividade 

(kg/ha) 

Estado 

Produtividade 

(kg/ha) 

Rondônia 

512 

Acre 

472 

Amazonas 

499 

Roraima 

414 

Pará 

452 

Amapá 

449 

Maranhão 

274 

Piauí 

86 

Ceará 

148 

Rio Grande do Norte 

91 

Paraíba 

137 

Pernambuco 

210 

Alagoas 

272 

Sergipe 

305 

Bahia 

229 

Minas Gerais 

447 

Espírito Santo 

426 

Rio de Janeiro 

568 

São Paulo 

585 

Paraná 

496 

Santa Catarina 

465 

Rio Grande do Sul 

493 

Mato Grosso Sul 

528 

Mato Grosso 

277 

Goiás 

393 

Distrito Federal 

596 


a) Construa um histograma dos dados. 

b) Forneça estimativas da média e do desvio-padrão da variável produtividade. 
1.6_P) Abono salarial 

Todos os empregados de uma empresa passaram a ganhar R$300,00 a mais mensal¬ 
mente a partir de uma certa data. 

O que se pode afirmar com respeito ao efeito dessa decisão sobre a variável salário 
dos empregados? 

a) O coeficiente de variação diminuiu. 

b) Tanto a média como o desvio-padrão aumentaram em R$300,00. 

c) Tanto a média como o desvio-padrão não se alteraram. 

d) O coeficiente de variação não se alterou. 

e) O coeficiente de variação aumentou. 

1.7_P) Análise da variável porosidade 

Um determinado arquivo de dados contém 521 observações que são localidades (ca¬ 
racterizadas por latitude, longitude e profundidade) e 5 variáveis, que são medições de 
propriedades físicas e geológicas do solo em diferentes localizações de uma região rica 
em petróleo. 

A tabela a seguir contem a distribuição de frequências da variável Porosidade. 


Classes 

Freqüência 

Absoluta 

Simples 

Classes 

Freqüência 

Absoluta 

Simples 

0 a 5 

0 

25 a 30 

192 

5a 10 

2 

30 a 35 

150 

10 a 15 

4 

35 a 40 

64 

15 a 20 

20 

40 a 45 

36 

J.0 à 25_ 

45 

45 a 50 

8 
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a) Calcule a média e o desvio-padrão dessa variável. 

b) Que percentagem das observações estão entre x-S e x+S? 

c) Calcule a mediana e a distância interquartil dessa variável. 

1.8_P) Densidade populacional em cada estado do Brasil 

Os dados a seguir se referem à densidade populacional de cada estado do Brasil con¬ 
forme apurado no censo de 1980. 


Estado 

Densidade (habitlkm 2 ) 

Estado 

Densidade (habitlkm 2 ) 

Rondônia 

2,02 

Acre 

1.97 

Amazonas 

0,92 

Roraima 

0,34 

Pará 

2,77 

Amapá 

1,26 

Maranhão 

12,31 

Piauí 

8,52 

Ceará 

36,02 

R G do Norte 

35,8 

Paraíba 

49,14 

Pernambuco 

62,49 

Alagoas 

71,7 

Sergipe 

51,84 

Bahia 

16,88 

Minas Gerais 

22,96 

Espírito Santo 

94,37 

Rio de Janeiro 

260,74 

São Paulo 

101,25 

Paraná 

38,33 

Santa Catarina 

38,00 

Rio Grande Sul 

29,06 

Mato Grosso Sul 

3,91 

Mato Grosso 

1,29 

Goiás 

6,01 

Distrito Federal 

203,94 


a) Calcule a média e o desvio-padrão da variável densidade. 

b) Suponha que um determinado valor da variável pode ser considerado discrepante 
dos demais se a distância entre esse valor e a média for maior que 3 desvios-pa¬ 
drão. Quais dos estados se enquadram nessa categoria de valores discrepantes? 

c) Construa um box plot para esses dados. 

d) Construa um box plot para as raízes quadradas desses dados. 

e) Construa um box plot para os logaritmos desses dados. 

0 Compare esses box plots quanto ao seu grau de simetria. 

Obs.: Para esses dados, Ix = 1153,84 e Ix 2 =150326,3774. 


1.9_P) Número de acomodações por estabelecimento hoteleiro no Rio de Janeiro 

Usando os dados da Tabela 2.9, construa uma nova variável que corresponde ao nú¬ 
mero de acomodações por estabelecimento em cada município do estado do Rio de Ja¬ 
neiro e verifique se ela apresenta observações discrepantes, por ambos os critérios aqui 
apresentados. 

1.10_P) Estudo epidemiolõgico sobre doenças coronarianas Fonte: Afift e Azen. 

Os dados aqui utilizados se referem a um estudo sobre doenças coronarianas realiza¬ 
do no Condado de Los Angeles, nos Estados Unidos. Trata-se de uma amostra com n = 
40 empregados desse condado para os quais somente algumas das variáveis medidas fo¬ 
ram aqui consideradas. 
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Descrição das variáveis: 


Nome Unidades 

Colesterol mg% 

Status socioeconômico nenhuma 

Peso lb 

Ano do falecimento Nenhum 


Aqui estão os dados: 


Colesterol 

Status SE 

Peso 

Ano Falec 

243 

3 

138 

66 

185 

3 

152 

66 

254 

2 

179 

64 

328 

3 

194 

0 

271 

3 

164 

65 

321 

3 

169 

0 

314 

1 

176 

0 

243 

4 

146 

0 

226 

3 

167 

0 

334 

3 

154 

0 

339 

5 

149 

0 

385 

3 

202 

0 

295 

4 

194 

0 

158 

1 

224 

68 

226 

2 

145 

63 

187 

5 

170 

66 

258 

3 

126 

64 

273 

3 

163 

64 

300 

1 

144 

64 

224 

3 

125 

65 


Comentários 

Aprox. p/ o inteiro mais próximo 
1 = alto, , 5 = baixo 
Aprox. p/ o inteiro mais próximo 
0 = Vivo, senão ano da morte 


Colesterol 

Status SE 

Peso 

Ano Falec 

328 

2 

137 

63 

207 

5 

188 

0 

325 

4 

1 14 

0 

250 

5 

207 

0 

290 

2 

178 

0 

210 

5 

179 

0 

260 

2 

169 

0 

310 

2 

138 

0 

220 

3 

160 

0 

190 

3 

187 

0 

260 

5 

194 

0 

210 

3 

188 

0 

220 

1 

178 

0 

260 

4 

186 

0 

230 

3 

204 

0 

300 

4 

202 

0 

230 

3 

122 

0 

220 

2 

149 

0 

180 

3 

142 

0 

260 

3 

152 

0 


a) Construa um histograma para cada uma dessas variáveis. 

b) Determine a média e a mediana de cada uma dessas variáveis. 

c) Determine o desvio-padrão e a distância interquartil de cada uma das variáveis 
anteriores. 



















































CAPITULO 2 


ESTUDANDO A RELAÇÃO 
ENTRE DUAS VARIÁVEIS 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Tabela de contingência 

• Percentuais de linha e percentuais de coluna 

• Covariância e coeficiente de correlação 

• Reta de regressão - mínimos quadrados 

• Variável a explicar e variável explicativa 


A Companhia Madeireira Rota Abaixo deseja calcular a quantidade total de metros cúbicos 
de madeira, em toras que podem ser extraídas de uma floresta de eucaliptos. Ela precisa fazer 
essa determinação em um prazo relativamente breve. 0 diâmetro da tora é de fácil obtenção, 
porém a altura é difícil de medir. Nem mesmo o uso de um instrumental apropriado é possível 
devido às árvores estarem próximas demais entre si. 

Sabedor da dificuldade de fazer a determinação da quantidade de madeira em pouco tempo, 
o engenheiro florestal a cargo da Bota Abaixo decide tentar uma estimativa por amostragem. A 
idéia é medir o perímetro do tronco e a altura (até o início da ramagem) de 20 árvores seleciona¬ 
das ao acaso e estender o resultado obtido ao conjunto de todas as 2.000 árvores da floresta. Ele 
namora uma estatística, Maria Eugênia, a quem expõe a sua idéia. 

A moça acha viável o projeto do engenheiro, mas diz ter um método mais preciso para fazer 
a estimativa. Pergunta se haveria condições de se medirem os perímetros dos troncos de todas as 
árvores da floresta em tempo razoavelmente curto. Tendo recebido resposta afirmativa, Maria 
Eugênia expõe o seu plano. Ela começa dizendo que, conforme aprendeu em uma palestra sobre 
Alometria, existe uma relação constante entre a altura e o diâmetro do tronco da árvore. Assim 
sendo, ela propõe que sejam selecionadas 20 árvores com troncos de diâmetros diferentes e me¬ 
didas suas alturas, conforme a idéia original. Em seguida, propõe ajustar uma reta de regressão 
linear aos dados obtidos. A inclinação da reta, que deve passar pela origem, fornecerá um valor 
que estabelece a relação entre a altura e o diâmetro do tronco. Dessa forma, uma vez medido o 
perímetro do tronco (do qual, obtemos o diâmetro) será calculado um valor estimado para a altu- 
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ro de cada uma das árvores da floresta. Com os valores do diâmetro e da altura, podemos ter 
uma estimativa bastante precisa do volume total de madeira disponível. 

Esse exemplo ilustra como, através do conhecimento da relação entre duas variáveis, pode¬ 
mos obter estimativas bastante precisas para uma variável difícil de medir, usando os resultados 
obtidos para uma outra variável de medição mais simples. 

Como obter essa relação a partir dos dados é, no caso de uma relação linear, um dos tópicos 
a serem vistos no presente capítulo. 


2.1 RELAÇÃO ENTRE VARIÁVEIS QUALITATIVAS - 
TABELAS DE CONTINGÊNCIA 

Quando se deseja investigar a relação entre duas variáveis qualitativas, o caminho 
natural é, a partir do conjunto de dados original (como, por exemplo, o que está na Ta¬ 
bela 1.1 ou na Tabela 1.2) montarmos uma tabela de contingência, contendo as fre¬ 
quências cruzadas relativas a essas duas variáveis. 

A montagem da tabela de contingência implica somente em se contar o número de 
ocorrências em cada cruzamento das duas variáveis (quadrícula da tabela). 

Uma vez obtida a tabela de contingência, é importante também que sejam calculados 
os percentuais de linha e de coluna. Através dessa abordagem, uma das variáveis é usa¬ 
da para dividir a população em estratos, e depois determina-se o perfil de freqüências 
relativas (ou percentuais) da outra variável em cada um desses estratos. 

Os exemplos a seguir devem esclarecer melhor essa estratégia. 


EXEMPLO 2.1: Dados antropométricos: Categoria versus Classe do 
índice de Massa Corporal (IMC) 

Voltemos aos dados antropométricos brutos que estão na Tabela 1.2. Nosso objetivo 
inicial é analisar se existe alguma relação entre a categoria (ativa ou sedentária) da pes¬ 
soa e a sua classe segundo o índice de massa corporal (normal ou sobrepeso). 

Para tanto, vamos obter a tabela de contingência relativa ao cruzamento dessas duas 
variáveis. 

Na montagem da Tabela 2.1, basta contarmos, por exemplo, quantas mulheres estão 
simultaneamente na Categoria “ativa” e na Classe de IMC “normal”: há 18 observações 
nesse cruzamento. 


TABELA 2.1 Tabela de contingência relativa às variáveis Categoria e 
Classe do índice de Massa Corporal, amostra de idosas 


Categoria 

Classe do índice de Massa Corporal 

Total 

normal 

sobrepeso 

Ativa 

18 

4 

22 

Sedentária 

9 

14 

23 

Total 

27 

_18_ 

45 
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Com base nessa tabela de contingência, foram obtidas as duas tabelas cie percentuais a 
seguir, com o objetivo de nos facilitara tareia de extrair conclusões a partir desses dados 
Na montagem da Tabela 2.2, uma vez lixada uma linha da I abela 2.1 (Categoria) foi 
calculado o percentual correspondente a cada coluna (Classe do índice de Massa Cor 
poral) com respeito ao total de linha. 

Por exemplo, na Tabela 2.1 verifica-se que o número total de mulheres na categoria 
“ativa” é igual a 22. Entre estas, 18 estão na Classe de 1MC “normal”, portanto, conclui-se 


que 


18 

122 J 


x 100 = 81,82% das mulheres ativas estão na classe de IMC normal. 


Note que os percentuais somam 100% ao longo de cada uma das linhas. 


TABELA 2.2 Percentuais (de linha) correspondentes às Classes do índice de 
Massa Corporal para cada uma das categorias de atividade, amostra de idosas 


Categoria 

Classe do índice de Massa Corporal 

Total 

normal 

sobrepeso 

Ativa 

81,82% 

18,18% 

100,00% 

Sedentária 

39,13% 

60,87% 

100,00% 

Total 

60,00% 

40,00% 

100,00% 


A Tabela 2.2 parece sugerir, por exemplo, que o percentual do grupo que tem o seu 
índice de massa corporal em um nível considerado normal é mais de duas vezes maior 
entre as mulheres ativas do que entre as sedentárias. (Ver figura a seguir) 



Ativa Sedentária Total 


FIGURA 2.1 Influência da atividade física sobre o peso. 


Observemos agora o que acontece quando calculamos percentuais de coluna em vez 
de percentuais de linha: 

Na montagem da Tabela 2.3 a partir da Tabela 2.1, uma vez fixada uma coluna da ta¬ 
bela (Classe do índice de Massa Corporal), foi calculado o percentual correspondente a 
cada linha (Categoria) com respeito ao total de coluna. 

Na Tabela 2.1 notamos, por exemplo, que existe um total de 27 mulheres que estão 

1 

na classe normal de IMC. Entre elas, 18 são da categoria “ativa” portanto — x 100 = 

’ 27 

66,67% das mulheres da classe “normal” de IMC são da categoria “ativa”. 

Note que os percentuais somam 100% ao longo de cada uma das colunas. 
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TABELA 2.3 Percentuais (de coluna) correspondentes às categorias de atividade 
para cada uma das Classes do índice de Massa Corporal, amostra de idosas 


Categoria 

Classe do índice de Massa Corporal 

Global 

Normal 

Sobrepeso 

Ativa 

66,67% 

22,22% 

48,89% 

Sedentária 

33,33% 

77,78% 

51,1 1% 

Total 

100,00% 

100,00% 

100,00% 


Vemos aqui, entre outras coisas, que o percentual relativo à categoria das mulheres 
ativas (ou seja, nào sedentárias) é três vezes maior entre as que têm o índice de massa 
corporal dentro de um padrão de normalidade do que entre aquelas que apresentam so¬ 
brepeso. 


EXEMPLO: 2.2: Pesquisa sobre consumo cultural 

Será que existe algum tipo de relação entre a idade de uma pessoa e o tipo de progra¬ 
ma que ela prefere na hora de escolher entre: ir ao cinema, ir ao teatro, assistir a um 
show de música etc.? Será que as preferências do público mais jovem são completamen¬ 
te diferentes das do público de meia-idade? Ou será que existe um desses programas 
que é sempre o preferido do público, independente da faixa etária? 

Em uma pesquisa de opinião, n = 499 pessoas foram ouvidas a respeito de suas prefe¬ 
rências em termos de consumo cultural. Admitiremos que essas pessoas representam 
uma amostra do “público jovem” do Rio de Janeiro. A cada um dos entrevistados pergun- 
tou-se, entre outras coisas, a sua faixa etária e qual entre cinco tipos de programa era mais 
do seu agrado. Com base nos resultados foi montada a seguinte tabela de contingência: 


TABELA 2.4 Tabela de contingência relativa às variáveis Faixa Etária e 
Programa Preferido em uma pesquisa de opinião sobre consumo cultural. 


Faixa etária 

Programa Preferido 

Total 

Cinema 

Exposições 

Teatro 

Dança 

Shows musicais 

18 a 21 

68 

1 

15 

9 

45 

138 

22 a 25 

66 

3 

21 

12 

42 

144 

26 a 30 

66 

8 

24 

1 1 

25 

134 

31 a 40 

39 

3 

16 

8 

17 

83 

Total 

239 

15 

76 

40 

129 

499 


Nossa intenção é procurar extrair algumas conclusões sobre a interdependência en¬ 
tre “Faixa Etária” e “Programa Preferido”, a partir dessa tabela de contingência. Gosta¬ 
ríamos que essas conclusões fossem aplicáveis à população como um todo, e não 
apenas a essa particular amostra. 

Mas, neste caso, uma constatação que salta aos olhos quando olhamos para a tabela 
de contingência é o lato ele que há relalivamente poucas ocorrências na coluna relativa a 
I xposiçoes. Isso implica que quaisquer proporções simples que venham a ser calcula¬ 
das a partir das frequências que constam nessa coluna poderão nào ser estatisticamente 
confiáveis. 
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Explicando melhor: com base nesses ciados, as pessoas que escolheram o programa 
Exposições se dividem pelas faixas etárias conforme a tabela a seguir: 


Faixa etária 

Freq. abs. 

Percentual 

18 a 21 

1 

6,67% 

22 a 25 

3 

20,00% 

26 a 30 

8 

53,33% 

31 a 40 

3 

20,00% 

Total 

15 

100,00% 


Suponha agora que dispuséssemos de uma outra amostra também formada por 499 
pessoas do público jovem. E digamos que nessa outra amostra houvesse também ape¬ 
nas 15 pessoas optando por Exposições, porém distribuídas entre as faixas etárias de 
forma levemente diferente: 


Faixa etária 

Freq. abs. 

Percentual 

18 a 21 

2 

13,33% 

22 a 25 

4 

26,67% 

26 a 30 

7 

46,67% 

31 a 40 

2 

13,33% 

Total 

15 

100,00% 


Como podemos observar, bastou introduzirmos uma pequena perturbação nas fre¬ 
quências absolutas para que ocorresse uma alteração expressiva nos percentuais. Ora, 
uma tal flutuação de uma amostra para outra é algo que está perfeitamente dentro do es¬ 
perado. 

Assim sendo, ficaria comprometido o nosso propósito de extrapolar para a popula¬ 
ção as conclusões extraídas a partir da amostra. 

Por isso, nossa primeira providência aqui será fundir em uma só as colunas referen¬ 
tes a Dança e Exposições, simplesmente somando as freqüências das duas. A nova colu¬ 
na criada recebe o rótulo de Dança / Exposições. Dessa forma, a nova tabela de 
contingência passou a ter apenas quatro colunas de contagens além da coluna de totais. 

Esse é um expediente muito utilizado na prática com o objetivo de se preservar a re- 
presentatividade estatística dos resultados. 


TABELA 2.5 Nova tabela de contingência relativa às variáveis 
Faixa Etária e Programa Preferido, após a fusão de duas colunas 


Faixa etária 

Programa Preferido 

Total 

Cinema 

Teatro 

Shows musicais 

Dança/Exposições 

18 a 21 

68 

15 

45 

10 

138 

22 a 25 

66 

21 

42 

15 

144 

26 a 30 

66 

24 

25 

19 

134 

31 a 40 

39 

16 

17 

1 1 

83 

Total 

239 

76 

129 

55 

499 
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Com base nessa nova tabela de contingência podem ser montadas as duas tabelas de 
percentuais a seguir, que certamente são mais informativas sobre a eventual existência 
de associação entre as duas variáveis aqui consideradas. 


TABELA 2.6 Percentuais (de linha) correspondentes aos Programas Preferidos 

uma vez fixada a faixa etária 


Faixa etária 

Programa Preferido 

Total 

Cinema 

Teatro 

Shows musicais 

Dança/Exposições 

18 a 21 

49,28 

10,87 

32,61 

7,25 

100,00 

22 a 25 

45,83 

14,58 

29,17 

10,42 

100,00 

26 a 30 

49,25 

17,91 

18,66 

14,18 

100,00 

31 a 40 

46,99 

19,28 

20,48 

13,25 

100,00 

Global 

47,90 

15,23 

25,85 

1 1,02 

100,00 


A Tabela 2.6 parece sugerir, por exemplo, que: 

a) Cinema é o programa preferido de praticamente metade do público considera¬ 
do, independente da faixa etária. 

b) Embora em todas as faixas etárias o segundo tipo de programa mais apontado 
seja shows musicais, há uma predominância dessa opção para o público de até 
25 anos. 

c) A preferência pelo teatro aumenta com a idade. 

Como já vimos antes, uma outra forma de encarar a interdependência entre as variá¬ 
veis “Faixa Etária” e “Programa Preferido” é inverter os papéis desempenhados por li¬ 
nhas e colunas, produzindo assim a tabela a seguir: 


TABELA 2.7 Percentuais (de coluna) correspondentes às faixas 
etárias uma vez fixado o Programa Preferido 


Faixa etária 

Programa Preferido 

Global 

cinema 

Teatro 

Shows musicais 

Dança/Exposições 

18 a 21 

28,45 

19,74 

34,88 

18,18 

27,66 

22 a 25 

27,62 

27,63 

32,56 

27,27 

28,86 

26 a 30 

27,62 

31,58 

19,38 

34,55 

26,85 

31 a 40 

16,32 

21,05 

13,18 

20,00 

16,63 

Total 

100,00 

100,00 

100,00 

100,00 

100,00 


A Tabela 2.7 parece sugerir, por exemplo, que pralicamente 2/3 do público adepto 
de shows musicais estão situados nas duas primeiras faixas etárias, ou seja, têm no má¬ 
ximo 25 anos de idade. 
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A figura a seguir corrobora essas conclusões. 




musicais Dança musicais Dança 


Contagem 


Percentagem 


FIGURA 2.2 Contagens e percentuais referentes aos Programas Preferidos para cada 
uma das faixas etárias consideradas, em uma pesquisa de opinião sobre consumo cultural. 


OBSERVAÇÃO: Note que esse gráfico é uma variação do gráfico de barras, levando em 
conta, ao mesmo tempo, programa preferido e faixa etária. ■ 

No Capítulo 8 veremos uma análise mais aprofundada das tabelas de contingência, 
usando o teste qui-quadrado para independência de variáveis. 

2.2 CORRELAÇÃO ENTRE VARIÁVEIS QUANTITATIVAS 

É claro que a mesma estratégia que acabamos de apresentar pode ser também utiliza¬ 
da para se analisar a relação entre duas variáveis quantitativas contínuas, se, antes de 
mais nada, apelarmos para uma “discretização”. Basta dividirmos em subintervalos o 
intervalo de variação de cada uma dessas variáveis e montarmos a tabela de contingên¬ 
cia correspondente. O mesmo procedimento se aplicaria ao caso de variáveis quantita¬ 
tivas discretas com muitos valores. (Ver faixas etárias utilizadas no exemplo anterior.) 

Porém, há também um outro indicador do grau de interdependência linear para duas 
variáveis quantitativas X e Y, no qual não se perde tanta informação quanto na “discreti¬ 
zação”. Trata-se do coeficiente de correlação r xy , que pode assumir qualquer valor real 
entre -1 e 1. 



FIGURA 2.3 Diagrama de Dispersão. 
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Para analisar o grau de interdependência linear entre duas variáveis quantitativas X e 
Y, sugere-se começar localizando os pares (x;, y,) como pontos em um sistema de eixos 
coordenados, denominado de Diagrama de Dispersão. O gráfico anterior, Figura 2.3, 
expressa a relação entre Peso e Circunferência da cintura para as mulheres da pesquisa 
antropométrica (Exemplo 1.2). 

A disposição dos pontos no sistema de eixos coordenados fornece uma indicação do 


coeficiente de correlação r, 

conforme vemos na Figura 2.4. 
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FIGURA 2.4 Disposição dos pares (x., y.) no plano e o coeficiente de correlação r . 

A análise da Figura 2.4 indica que: 

• Se os pontos estiverem dispostos em torno de uma rela com inclinação positiva, o 
valor de r xy estará entre 0 e + J, como na Figura 2.4(a). Quanto mais próximos esses 
pomos estiverem da reta, mais próximo r xy estará de +1, como na Figura 2.4(b). 

• Sc os pomos estiverem dispostos em lorno de uma reta com inclinação negativa, o 
valor de j estará enire I e 0, como na Figura 2.4(c). Quanto mais próximos esses 
pontos estiverem da rela, mais próximo i s eslara de I ,como na Figura 2.4(d). 
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• Se os pontos estiverem bastante dispersos na ligura, de íorrria a que não se possa 
identificar algum tipo de dependência linear entre X e Y, r xy estará próximo de 0, 
como na Figura 2.4 (e). 


O coeficiente de correlação entre X e Y é calculado a partir dos dados por uma 
das duas expressões matemáticas (equivalentes) a seguir: 

£(x t — x)(yj -y) Zí^iYi -n-x-y 

r xy =-—-=-—- 

<£(*, -x) 2 - £(y, - y) 2 ) 1/! ((£x 2 -n-x 2 )(£y 2 -ny)} 1/2 

i =1 i =1 i =1 i =1 

A covariância entre X e Y é calculada pela seguinte expressão: 


£( Xi -xXy, -y) Jx^, -nxy 


S = -^L 

xy 


i=l 


n -1 


n -1 


=r -S -S 

xy x y 


onde S x e S são desvio-padrão de X e de Y, respectivamente. 


Portanto, o coeficiente de correlação também pode ser obtido calculando-se a cova¬ 
riância entre X e Y e dividindo-a pelo produto dos desvios-padrão de X e de Y, ou seja : 


r *y = 


xy 


s. -s. 


Exercitando: 

• Analisando o comportamento dos pontos na Figura 2.3, o que você diria sobre o 
valor de r (sem calculá-lo)? 

• A partir dos dados da Tabela 1.2, calcule agora a covariância e o coeficiente de cor¬ 
relação e verifique se a sua resposta à pergunta anterior está correta. 


EXEMPLO 2.3: Telefonia fixa per capita versus renda per capita 

Será que é possível estabelecermos uma fórmula matemática para calcular o número 
de linhas telefônicas por mil habitantes em um estado do Brasil a partir da renda per ca¬ 
pita nesse estado? Veremos neste exemplo, e principalmente em sua continuação no 
Exemplo 2.5, como a Estatística pode nos fornecer respostas para perguntas como essa. 

A Tabela 2.8 de dados brutos a seguir nos permite investigar a interdependência das 
variáveis: 


x = renda per capita 
e 

y = telefonia fixa per capita 


com base em estatísticas de 2001 para cada estado do Brasil. 
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TABELA 2.8 Telefonia fixa em função da renda por estado do Brasil 


Estado 

População 

Telefonia fixa 

y = Tel. fixa per capita 

x = Renda per capita 
(1.000 reais) 

Acre 

557226 

102.4 

0.183767448 

1.841 

Alagoas 

2819172 

353.6 

0.125426898 

1.482 

Amapá 

475843 

92 

0.193341081 

1.789 

Amazonas 

2813085 

455.7 

0.161992972 

2.35 

Bahia 

13066910 

1858.8 

0.142252453 

1.59 

Ceará 

7418476 

1042.8 

0.140567955 

1.187 

D. Federal 

2043169 

933.3 

0.456790407 

6.259 

Espírito Santo 

3094390 

707.8 

0.22873652 

2.403 

Goiás 

4996439 

1 156.3 

0.231424821 

1.904 

Maranhão 

5642960 

485.6 

0.0860541276 

0.837 

Mato Grosso 

2502260 

499.4 

0.19957958 

2.147 

Mato Grosso Sul 

2074877 

488.2 

0.235291056 

3.285 

Minas Gerais 

17866402 

3905 

0.218566671 

2.647 

Pará 

6189550 

792.2 

0.127989918 

1.687 

Paraíba 

3439344 

431.3 

0.125401821 

0.964 

Paraná 

9558454 

2333.8 

0.244160823 

2.87 

Pernambuco 

7911937 

1 169.1 

0.147764068 

1.437 

Piauí 

2841202 

335.8 

0.1 18189414 

0.792 

Rio de Janeiro 

14367083 

4991.9 

0.347453968 

3.82 

Rio Grande Norte 

2771538 

416.1 

0.150133247 

1.575 

Rio Grande Sul 

10181749 

241 1.6 

0.236855181 

3.399 

Rondônia 

1377792 

295.7 

0.214618752 

2.421 

Roraima 

324152 

69.4 

0.21409709 

2.25 

Santa Catarina 

5349580 

1376.4 

0.257291227 

3.031 

São Paulo 

36969476 

13413.6 

0.362829054 

4.859 

Sergipe 

1781714 

250.6 

0.140651081 

1.498 

Tocantins 

1155913 

131.6 

0.1 13849399 

0.6 


Para esses dados, temos: x = 2,256 y = 0,200 
£( Xj -x)(y, -y) = 2,684 

i=i 

£(x, -x) ! = 42,112 


2>, -yY- 0,185 


Então, r xy 


2,684 

J+IJ 12 x 0,185 


0,061 


() grafu o de y ronira x r o seguinlc 
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FIGURA 2.5 Telefonia fixa per capita em função da renda per capita. 


Aqui tanto o valor calculado de r xy como o gráfico parecem sugerir que há uma forte 
dependência linear positiva entre renda per capita e telefonia fixa per capita. É claro que 
um tal comportamento está dentro do esperado, uma vez que, quanto maior é o poder 
aquisitivo da população, maior tende a ser o seu consumo de bens e serviços. 


EXEMPLO 2.4: Hotelaria nas regiões turísticas do Estado do Rio de Janeiro 

A tabela a seguir contém um levantamento do número de estabelecimentos hotelei¬ 
ros e do número total de acomodações que eles ofereciam no ano de 2001, para cada um 
dos municípios do Rio de Janeiro. 

Aqui estão os dados: 


TABELA 2.9 Dados de hotelaria no estado do Rio de Janeiro em 2001 


Município 

Estab. 

Acom. 

Município 

Estab. 

Acom. 

Município 

Estab. 

Acom. 

Areal 

3 

88 

S. J. Vale do Rio Preto 

5 

197 

São Sebastião do Alto 

3 

53 

Barra Mansa 

22 

1 718 

Silva Jardim 

6 

439 

Sumidouro 

1 

59 

Barra do Pirai 

18 

1 199 

Teresópolis 

44 

2 876 

Trajano de Morais 

2 

62 

Eng. Paulo de Frontin 

8 

684 

Vassouras 

9 

504 

Araruama 

17 

1 157 

Itatiaia 

121 

4 214 

Aperibé 

2 

60 

Armação dos Búzios 

149 

7 248 

Manngá 

17 

484 

B. J. do Itabapoana 

4 

249 

Arraial do Cabo 

33 

1 564 

Maromba 

20 

468 

Cambuci 

3 

85 

Cabo Frio 

74 

5 549 

Penedo 

55 

2 289 

Campos dos Goytacazes 

49 

2 792 

Casimira de Abreu 

18 

679 

Mendes 

5 

148 

Cardoso Moreira 

2 

70 

Iguaba Grande 

4 

239 

Paraíba do Sul 

12 

639 

Italva 

3 

1 18 

Maricá 

17 

441 

Pirai 

7 

701 

Itaocara 

7 

283 

São Pedra da Aldeia 

21 

1 082 

Poito Real 

4 

1 15 

Itaperuna 

25 

2619 

Saquarema 

25 

1 283 

Quatis 

5 

267 

Raposo 

10 

1 592 

Angra dos Reis 

160 

8 693 

Resende 

36 

2 124 

Miracema 

6 

193 

Ilha Grande 

90 

3 034 

Engenheiro Passos 

4 

368 

Natividade 

2 

100 

Mangaratiba 

17 

2 034 

Visconde de Mauá 

12 

247 

Poroúncula 

3 

111 

Paraty 

149 

5 315 

Rio Claro 

10 

160 

Santa Mana Madalena 

2 

85 

Trindade 

27 

632 

Rio das Flores 

2 

40 

Sto Antomo Pádua 

11 

548 

Belford Roxo 

4 

338 

Sapucaia 

5 

228 

São Fidélis 

5 

262 

Duque de Caxias 

24 

2 227 
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Município 

Estab. 

Acom. 

Município 

Estab. 

Acom. 

Município 

Estab. 

Acom. 

Três Rios 

15 

826 

S. Fco Itabapoana 

11 

421 

Itaboraí 

5 

366 

Valença 

34 

1 859 

São João da Barra 

12 

2 622 

Itaguai' 

II 

895 

Conseivatória 

20 

1 289 

São José de Ubá 

1 

16 

Magé 

8 

249 

Volta Redonda 

14 

1 463 

Varre-Sai 

2 

65 

Nilópolis 

7 

724 

Cachoeiras de Macacu 

14 

700 

Bom Jardim 

4 

245 

Niterói 

40 

2 861 

Guapiminm 

7 

430 

Cantagalo 

7 

450 

Nova Iguaçu 

22 

1 979 

Miguel Pereira 

12 

1 060 

Carapebus 

1 

32 

Paracambi 

1 

48 

Nova Fnburgo 

84 

3 853 

Carmo 

3 

112 

Queimados 

1 

84 

Lumiar 

16 

312 

Conceição de Macabu 

4 

258 

Rio de Janeiro 

397 

50910 

São Pedro da Serra 

14 

319 

Cordeiro 

5 

158 

São Gonçalo 

25 

2215 

Paty do Alferes 

8 

697 

Duas Barras 

5 

65 

São João de Menti 

22 

2 182 

Petrópolis 

83 

3 203 

Macaé 

46 

2 688 

Seropédica 

2 

153 

Petrópolis /arredores 

58 

1 837 

Sana 

13 

321 

Tanguá 

1 

22 

Rio Bonito 

6 

478 

Quissamã 

4 

201 





Estab. = N° de estabelecimentos Acom. = N° de acomodações 

Fonte: IBGE, Diretoria de Pesquisas, Departamento de Comércio e Serviços, Pesquisa Especial sobre Meios de Hospedagem 2001. 


Queremos analisar a relação de dependência entre as variáveis x = número de estabe¬ 
lecimentos hoteleiros e y = número total de acomodações. 

Solução: 


o 



Número de Estabelecimentos 


FIGURA 2.6 Número de acomodações versus número de estabelecimentos. 

O primeiro passo aqui foi a obtenção do diagrama de dispersão relativo a x e y: 

Fica claro nesse gráfico que, para ambas as variáveis, há uma forte assimetria para a 
direita da respectiva distribuição de freqüências. Por isso mesmo, o município do Rio 
de Janeiro destoa totalmente dos demais, dificultando assim a nossa tarefa de medir o 
grau de associação entre as duas variáveis aqui consideradas. 

Felizmente, em tais casos, há um artifício que pode nos ajudar bastante. Basta apli¬ 
carmos previamente a cada uma dessas variáveis uma transformação logarítmica. Ou 
seja, consideraremos as novas variáveis u = ln(x) e v = ln(y). 

Vejamos agora como lica “muito mais simpático” o diagrama de dispersão de u 
contra v: 
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u=log(Número de Estabelecimentos) 

FIGURA 2.7 ln(n- acomodações) versus ln(n- estabelecimentos) 

Determinemos agora o coeficiente de correlação entre as variáveis u e v. 

A partir dos dados se obtém 

Xu = 226,2816 Iv = 607,2678 lu 2 = 685,6929 Iv 2 = 3982,63 luv = 1579,351 


1579,351- 


Logo, r uv = 


226,2816x607,2678 

98 


685,6929 


226,2816 
98 


2 \ 


3982,63 - 


607,2678 

98 


2 \ 


= 0,936 


Então, novamente, tanto o valor calculado de r como o gráfico anterior parecem su¬ 
gerir que há uma forte interdependência linear positiva entre as variáveis u = ln(x) e v = 
ln(y). Ou seja, quanto maior o número de hotéis em uma cidade, maior é o número de 
acomodações à disposição do público na rede de hotelaria. ■ 


ALGUNS COMENTÁRIOS SOBRE O COEFICIENTE DE CORRELAÇÃO r: 

1. É importante ressaltar que o coeficiente de correlação mede um tipo específico 
de interdependência, a saber, interdependência linear. Isso quer dizer que 
mesmo havendo uma forte dependência entre duas variáveis quantitativas, se a 
relação entre elas for do tipo não-linear (veja, por exemplo, a Figura 2.8), o co¬ 
eficiente de correlação entre elas poderá não ser muito alto em módulo. 

2. Assim como a média e o desvio-padrão, o coeficiente de correlação r xy é uma me¬ 
dida pouco resistente à presença de observações discrepantes. Isso quer dizer 
que se a um conjunto de pontos, todos situados em torno de uma reta, forem 
acrescentados alguns poucos pontos que estejam bastante afastados dessa reta, o 
módulo do coeficiente de correlação poderá diminuir substancialmente. 

2.3 O AJUSTE DA RETA DE REGRESSÃO POR MÍNIMOS QUADRADOS 

Quando se verifica através do coeficiente de correlação (e pelo próprio aspecto 
visual do diagrama de dispersão) que existe uma forte relação linear entre duas va¬ 
riáveis x e y, pode ser de interesse calcular a equação da reta que representa esta relação 
entre as duas variáveis: 


y = a + b.x 
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Costuma-se considerar aqui que y é a variável a explicar (ou variável dependente) 
cujo comportamento se deseja explicar. Por outro lado, x é a variável explicativa (ou 
variável independente) a ser usada para explicar o comportamento da variável y. 

A equação da reta pode ser usada, por exemplo, para se estimar qual seria o valor y 0 da 
variável resposta y correspondente a um determinado valor x 0 da variável preditora x. 

Esse procedimento costuma ser utilizado principalmente nos casos em que a medi¬ 
ção da variável resposta y é mais cara, difícil ou demorada, enquanto a medição da va¬ 
riável explicativa x é mais barata, fácil ou rápida. 

Suponha que se dispõe de um conjunto de n pares de dados (x„ y^ como nos exem¬ 
plos anteriores. Então pode ser usado o método dos mínimos quadrados para se obter a 
equação da reta que melhor se ajusta aos n pontos que representam esses dados no pla¬ 
no bidimensional. Como, em geral, a relação de dependência linear entre y e x não é 
perfeita, costuma-se introduzir na equação um termo relativo ao erro do modelo de 
predição: 

y = a + b . x + erro. 


A interpretação do significado dos coeficientes a e b é a habitual, ou seja: 

• O coeficiente b mede a inclinação ou coeficiente angular da reta de regressão. 

Ay 

Então, ao passarmos de um ponto a outro sobre a reta, b mede a relação — , onde 


Ax 


Ay e Ax representam, respectivamente, as variações de y e de x. 


• O coeficiente a mede o valor de y quando x é igual a zero, ou seja, o intercepto da 
reta de regressão. 


As fórmulas que nos permitem calcular os valores de a e b a partir dos dados são: 


b = 


£(x, -x)(y, -y) 

i =1_ 

2>, -x) ! 

i=i 



a = y - b • x = 



n 

Entre iodas as relas do tipoy = a + bx, a reta obtida pelo método dos mínimos quadra¬ 
dos e aquela que torna mínima a soma: 


X f y. “(a 4 bx, )Y 


que lepreseiita a soma dos quadrados das n dilereiiças enire os dois valores de y: o ob 
servado (yj e o valoi ajuslado y, , < ah ulado alraves da equaçao da rela (a r bx,). 
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EXEMPLO 2.5: Telefonia fixa per capita versus renda per capita 

Usando os mesmos ciados (Tabela 2.8) do exemplo sobre Telefonia I ixa em função 
de renda: 

a) Expresse a variável y = Telefonia Fixa per capita como y = a + b x + erro, onde x = 
renda per capita. Quais seriam os valores de a e b calculados através do método 
de mínimos quadrados e qual o significado do coeficiente b? 

b) Com base nesse ajuste linear, qual seria o valor da variável Telefonia Fixa per ca¬ 
pita para um estado onde a renda per capita fosse de 2.000 reais? 

Por quê? 

Solução: 

a) Aqui a renda per capita será usada como preditora da telefonia fixa per capita. Os 
coeficientes da reta de regressão são 

b= 2,684 =0,0637 e a = 0,200 - 0,0637 x 2,256 = 0,0564. 

42,112 

Isso quer dizer que quando a renda per capita de um determinado estado au¬ 
menta em 1.000 reais, há em média um aumento de aproximadamente 63,7 li¬ 
nhas telefônicas para cada 1.000 pessoas. 

b) Espera-se que o valor de telefonia fixa per capita para um estado onde a renda per 
capita fosse de 2.000 reais seja, então, 

y =0,0564 +0,0637 x 2 =0,1838 

isto é, pouco mais de 18 linhas telefônicas para cada 100 pessoas. 


EXEMPLO 2.6: Hotelaria nas regiões turísticas do Estado do Rio de 
Janeiro (cont.) 

Usando os mesmos dados (Tabela 2.9) do exemplo anterior sobre hotelaria no Esta¬ 
do do Rio de Janeiro: 

a) Expresse a variável v = lny como v = a + b u + erro, onde u = lnx. Quais seriam os 
valores de a e b calculados através do método de mínimos quadrados e qual o 
significado do coeficiente b? 

Obs.: Pode ser demonstrado que neste caso vale a relação — ^b — 

Y x 

b) Com base nesse ajuste linear, qual seria o número total de acomodações em um 
município onde houvesse 30 estabelecimentos hoteleiros? Lembre-se de que o 
operador inverso do ln(.) é exp(.). 
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Solução: 

a) Os coeficientes da reta de regressão seriam 


1579 



226,2816x607,2678 


b = 


= 1,0855 


98 


607,2678 - 1,0855 x 226,2816 
98 


= 3,6901 


Como interpretar o significado do coeficiente b? 

Tomemos um exemplo específico. Segundo os dados, em 2001 havia em Te- 
resópolis 44 estabelecimentos hoteleiros, capazes de acomodar 2.876 pessoas. 
Então, se nesse ano, por exemplo, o número de estabelecimentos desse municí¬ 
pio aumentasse em 5 unidades, ou seja, de 44 para 49, o aumento previsto no 
número total de acomodações deveria ser aproximadamente 


1,0855 x — x 2876 = 355 
44 


ou seja, ele passaria de 2.876 para algo em torno de 3.231. 
b) Estima-se que o número total de acomodações em um município onde houvesse 
30 estabelecimentos hoteleiros seria algo em torno de 

exp(3,6901 + l,0855ln(30)) = 1607 

■ 

E se houver uma forte relação de dependência monotônica (ou seja, estritamente 
crescente ou estritamente decrescente) entre as variáveis x e y, mas ela for do tipo 
não-linear, como na figura a seguir? 

Uma tal dificuldade poderia ser contornada através do uso de transformações de va¬ 
riável. Esse tema não será aqui abordado, já que foge ao escopo deste livro. 


A 


y 



> x 


FIGURA 2.8 Relação de dependência não-linear entre y e x. 
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RESUMO DO CAPÍTULO 2 

• Quando se deseja investigar a relação entre duas variáveis qualitativas, o c ami¬ 
nho natural é montar uma tabela de contingência. 

• Construir uma tabela de contingência consiste em colocar nas linhas os va¬ 
lores possíveis de uma variável e nas colunas os valores possíveis da outra 
variável. Feito isso, o próximo passo é contar o número de ocorrências em 
cada cruzamento. 

• Para analisar a relação entre duas variáveis através de uma tabela de contingên¬ 
cia, um procedimento muito útil é calcular os percentuais em relação aos totais 
das linhas e também os percentuais em relação aos totais das colunas. 

• Quando se deseja investigar a relação entre duas variáveis quantitativas, o mais 
adequado é começar pela construção de um diagrama de dispersão. 

• Construir um diagrama de dispersão para duas variáveis quantitativas X e Y 
consiste em localizar pares de valores observados (x,, y,) como pontos em um 
sistema de eixos coordenados. 

• Um indicador do grau de interdependência linear para duas variáveis quantita¬ 
tivas X e Y é o coeficiente de correlação r xy , que pode assumir qualquer valor 
real entre -1 e 1. 

• O coeficiente de correlação entre X e Y é calculado por uma das duas expressões 
matemáticas (equivalentes) a seguir: 

2^(x l -x)(y i -y) £x,y.-n-x-y 

r _ _ ifl _ _ _1=1_ 

|£(x,-x) ! •£(;>-,-y) 2 } 1 * K£x:-n-x 2 x£;y:-n.5 ! )l 1/2 

i=l i=l i=l 

• Quanto mais próximo de 1 ou de -1 estiver o valor de r xy , mais forte será a rela¬ 
ção linear entre as duas variáveis X e Y (ver Figura 2.4). 

• Se houver uma forte interdependência entre elas, mas essa relação for do tipo 
não-linear, o coeficiente de correlação poderá não ser muito alto em módulo. 

• O coeficiente de correlação r xy é uma medida pouco resistente à presença de ob¬ 
servações discrepantes. 

• Quando se verifica através do coeficiente de correlação (ou pelo aspecto visual 
do diagrama de dispersão) que existe uma forte relação linear entre duas variá¬ 
veis X e Y, pode ser de interesse calcular a equação da reta que representa essa 
relação entre as duas variáveis: y = a + b.x. 

• A equação y = a + b.x considera que y é a variável a explicar (ou variável depen¬ 
dente) e que x é a variável explicativa (ou variável independente) a ser usada 
para explicar o comportamento da variável y. 

• A equação da reta pode ser usada para se antever qual seria o valor y 0 da variável 
resposta y correspondente a um determinado valor x 0 da variável preditora x. 
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• As fórmulas que nos permitem calcular os valores de a e b a partir dos dados 
são: 


n 


n 


n 


2>.y.- 2>. £y. 


b = 


i=l 


1=1 


/n 


í=i / 


. íí*.) 

Z*?-— j 


a = y - b • x 


i-l 


n 


• Interpretação do significado dos coeficientes a e b: 

O coeficiente b mede a inclinação da reta de regressão. Então, ao passarmos de 

um ponto a outro sobre a reta, b mede a relação — entre as variações de y e de x. 

Ax 

O coeficiente a mede o valor de y quando x é igual a zero, ou seja, é o intercepto 
da reta de regressão. 


EXERCÍCIOS RESOLVIDOS 

2.1_R) Condições de trabalho vistas por empregados de diferentes setores de uma 
empresa. 

Uma pesquisa de clima organizacional é uma pesquisa de opinião através da qual se 
pretende investigar o nível de satisfação e motivação dos empregados de uma determi¬ 
nada empresa. Suponha que foi feita uma pesquisa de clima organizacional na empresa 
X. Os empregados a serem entrevistados foram selecionados através de um processo de 
amostragem dentro de cada um dos três departamentos da empresa. Em cada um dos 
três departamentos, o número de entrevistas realizadas é proporcional ao contingente 
total de empregados naquele departamento. O relatório correspondente indica que, 
com relação às condições de trabalho oferecidas aos empregados, dentro de cada um 
dos três departamentos dessa empresa, as opiniões se dividem conforme indica a tabela 
a seguir. 


Avaliação das Condições de Trabalho 


Departamento 

N° de 
entrevistas 

Insatisfeitos 

Pardalmente 

satisfeitos 

Satisfeitos 

Comercial 

75 

84,00% 

10,67% 

5,33% 

Pessoal 

75 

53,33% 

40,00% 

6,67% 

Produção 

200 

42,00% 

36,00% 

22,00% 


Quais das seguintes afirmações estão corretas e quais não estão? Por quê? 

a) O percentual de empregados insatisfeitos, considerando a empresa como um 
iodo é a média aritmética dos valores que estão nessa coluna, isto e, 

^ (84 + 53,53 + 42 ) 59 , 78 %. 
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b) O número de empregados insaiislei los e maior no Deparlamento de Produção 
do que no Departamento Comercial. 

c) Considerando somente os empregados parcialmentc satisfeitos, o percentual 
daqueles entre eles que estão no Departamento de Pessoal é maior do que os per 
centuais correspondentes aos outros dois departamentos. 

d) Suponha também que entre as perguntas do questionário havia uma em que o en¬ 
trevistado deveria atribuir ao plano de saúde oferecido pela empresa uma avalia¬ 
ção que podia variar desde péssimo até ótimo. Adotando a pontuação 1 = péssimo, 
2 = ruim, 3 = regular, 4 = bom, 5 = ótimo, foram calculados os seguintes valores: 


Nível de satisfação com o plano de saúde 


Departamento 

N° de 
entrevistas 

Média 

Desvio-padrão 

Comercial 

75 

2,76 

1,32 

Pessoal 

75 

2,85 

2,43 

Produção 

200 

3,71 

2,78 


Daí se conclui que o nível de satisfação médio dos empregados com o plano de saúde 
é mais alto no departamento de produção do que nos outros dois departamentos. 


Solução: 

a) Não. Aqui, em vez de uma média aritmética, o que caberia é o cálculo de uma 

... , , 84x75 + 53,33x75 + 42x200 

media ponderada:-= 53,43% 

75 + 75 + 200 

b) Correto. Embora o percentual de insatisfeitos seja maior no Departamento Co¬ 
mercial do que nos outros dois, o número de empregados insatisfeitos é maior 
no Departamento de Produção (42% de 200 = 84) do que no Departamento Co¬ 
mercial (84% de 75 = 63). 

c) Usando o mesmo raciocínio do item (b), em termos do quantitativo de emprega¬ 
dos a tabela correta seria 

Avaliação das Condições de Trabalho 


Departamento 

Insatisfeitos 

Parcialmente 

satisfeitos 

Satisfeitos 

Comercial 

63 

8 

4 

Pessoal 

40 

30 

5 

Produção 

84 

72 

44 


Assim sendo, entre os empregados parcialmente satisfeitos, o percentual corres¬ 
pondente ao Departamento de Produção (ou seja,-—- x 100 =65 45%1 é 

8+30 + 72 ’ ' 

maior do que o percentual correspondente ao Departamento de Pessoal (ou seia 

30 ’ 

-———— x 100 = 27,27%). Então, a afirmação não estava correta. 

8 + 30 + 72 

d) Cuidado! Aqui não faz sentido calcular média e desvio-padrão, já que a variável 
considerada é qualitativa, ainda que ordinal. 
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2.2_R) Intenção de voto em função da faixa etária do eleitor 

Com base em uma pesquisa eleitoral relativa ao segundo turno da eleição para a Pre¬ 
feitura de uma determinada cidade, foi obtida a seguinte tabela, que informa a preferên¬ 
cia do eleitorado por faixa etária. 


Idade (em anos) 

Candidato C1 

Candidato C2 

Brancos, Nulos e Indecisos 

15—>25 

70% 

10% 

20% 

25 -> 35 

50% 

20% 

30% 

35 —> 45 

40% 

40% 

20% 

45 -> 55 

30% 

60% 

10% 

55 -> 65 

20% 

70% 

10% 


Através dessa mesma pesquisa apurou-se também que a distribuição por faixa etária 
do eleitorado é a seguinte: 


Faixa Etária (em anos) 

15—>25 

25 -> 35 

35 -> 45 

45 -> 55 

55 -> 65 

Percentual 

25% 

30% 

25% 

15% 

5% 


Pergunta-se: 

a) Que percentual do eleitorado total (entre 15 e 65 anos de idade) pretende votar em 
Cl ? E em C2? Qual o percentual correspondente a brancos, nulos e indecisos (BNI)? 

b) Quais são a média e o desvio-padrão da idade do eleitorado do candidato Cl? 

c) Quais são a mediana e o intervalo interquartil da idade do eleitorado do can¬ 
didato C2? 


Solução: 

Os valores da primeira tabela já nos fornecem uma primeira impressão de que o can¬ 
didato Cl conta principalmente com o apoio do eleitorado mais jovem, enquanto o 
candidato C2 conta principalmente com a preferência dos mais idosos. 


a) Para calcular a proporção de intenção de voto em Cl trabalhamos com a coluna 
referente a esse candidato na primeira tabela, bem como a distribuição por faixa 
etária que está na segunda tabela. 

Int. voto Cl = 0,70x0,25+0,50x0,30+0,40x0,25+0,30x0,15+0,20x0,05 = 0,48 
Analogamente podemos calcular também 

Int. voto C2 = 0,10x0,25+0,20x0,30+0,40x0,25+0,60x0,15+0,70x0,05 = 0,31 e 
Int. voto BNI = 0,20x0,25+0,30x0,30+0,20x0,25+0,10x0,15+0,10x0,05 = 0,21 

Assim, as intenções de voto globais são: 48% para Cl, 31% para C2, e 21% para BNI. 

b) As frequências correspondentes a cada faixa etária no eleitorado de Cl são: 


Faixa etária 

Frequência relativa 

Ponto médio 

15 ->25 

0,365 

20 

25 + 35 

0,313 

30 

35 -> 45 

0,208 

40 

45 -> 55 

0,094 

50 

55 >65 

0,021 

60 
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onde 0,365 = 0,70 x 0,25/0,48; 0,313 = 0,50 x 0,30/0,48; etc. 

Então, trabalhando com o ponto médio de cada intervalo, para o eleitorado de 
Cl, a média de idade (em anos) é 

x = 20 x 0,365 + 30 x 0,313 + 40 x 0,208 + 50 x 0,094 + 60 x 0,021 = 30,94 


e o desvio-padrão da idade (em anos) é 

S = (20 2 x 0,365 + 30 2 x 0,313 + 40 2 x 0,208 + 50 2 x 0,094 + 60 2 x 0,021 - 30,94 2 )* 
= 10,61 

c) Analogamente, as freqüências correspondentes a cada faixa etária no eleitorado 
de C2 são 


Faixa etária 

Freqüência relativa 
simples 

Freqüência relativa 
acumulada 

15 —>25 

0,081 

0,081 

25 —> 35 

0,194 

0,275 

35 —» 45 

0,323 

0,598 

45 —> 55 

0,290 

0,888 

55 —» 65 

0,1 13 

1,001 


Os quartis da variável idade relativa ao eleitorado de C2 são: 


Q1 = 25 + -- 5 — 0,081 x 10 = 33,71 Q2 = 35 + ° ,5 ° _°; 275 x 10 = 41,96 


0,194 


0,323 


0 75 — 0 5Q8 

45 + o,^o x 10 = 50 24 Q3 - Q1 = 16,53 

0,290 

Obs.: Para uma explicação mais detalhada desse tipo de raciocínio, veja o Exercício 
1.2_R. 

Portanto, mediana = 41,96 anos e distância interquartil = 16,53 anos. 

Esses resultados corroboram a nossa impressão inicial de que Cl é o preferido do 
eleitor mais jovem, enquanto o eleitorado de C2 já é formado principalmente pelos elei¬ 
tores de idade mais avançada. 

2.3_R) Estatísticas sobre segurança no país 

Os dados a seguir se referem a estatísticas oficiais sobre a questão da segurança no 
país em 2001 . 


TABELA - Estatísticas sobre Segurança no Brasil em 2001 


Estado 

x = n- de policiais 

y - n- de presos 

u = '°gio(x) 

v = log,o(y) 

AC 

2922 

1 196 

3,46568 

3,077731 

AL 

8789 

840 

3,943939 

2,924279 

AP 

3297 

850 

3,5181 19 

2,929419 
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Estado 

x - n 2 de policiais 

y = n- de presos 

u = l°gio( x ) 

v = logio(y) 

AM 

7094 

1603 

3,850891 

3,204934 

BA 

32723 

4927 

4,514853 

3,692583 

CE 

13408 

5860 

4,127364 

3,767898 

DF 

19792 

4870 

4,29649 

3,687529 

ES 

9834 

3737 

3,99273 

3,572523 

GO 

12291 

5255 

4,089587 

3,720573 

MA 

7942 

2905 

3,89993 

3,463146 

MT 

6351 

2133 

3,802842 

3,328991 

MS 

6296 

4435 

3,799065 

3,646894 

MG 

45596 

17471 

4,658927 

4,242318 

PA 

14850 

3012 

4,171726 

3,478855 

PB 

8344 

3963 

3,921374 

3,598024 

PR 

22916 

9594 

4,360139 

3,982 

PE 

22056 

8840 

4,343527 

3,946452 

PI 

7495 

812 

3,874772 

2,909556 

Bl 

42601 

20726 

4,62942 

4,316515 

RN 

8346 

1 175 

3,921478 

3,070038 

RS 

26941 

14045 

4,430414 

4,147522 

RO 

4564 

2685 

3,659346 

3,428944 

RR 

1781 

410 

3,250664 

2,612784 

SC 

16382 

4566 

4,214367 

3,659536 

SP 

115077 

94737 

5,060989 

4,97652 

SE 

5567 

1601 

3,745621 

3,204391 

TO 

3680 

972 

3,565848 

2,987666 


Com base nesses dados foi obtido o seguinte gráfico. 


O 


O) 

o 



3.0 3.5 4.0 4.5 

u = Iog10(x) 


5.0 


5.5 


a) Calcule o coeficiente de correlação entre u e v. 

b ) Recalcule esse mesmo coeficiente excluindo da amostra o estado de São Paulo, 
t) Que conclusões podem ser extraídas dos resultados de (a) c (b)? 

Paia facilitar os seus cálculos, são fornecidos: 

Lu = 109,110 Lv = 95,577 

Lu' - 44*3, f 14 Lv' = 345,426 Xuv = 391,281 
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Solução: 

a) Com a amostra completa, temos 

^uv -(^V^v)/n _ 

r "' = j(2> 2 -0»7")(2> 2 -Tl^jV") 


391,281 


109,110x95,577 

27 


1 


( 109,110 

445,314 - 




27 


2 V 345,426-^ 

27 


2 \ 


= 0,904. 


b) Excluindo o estado de São Paulo, ficamos com 


Su = 109,110 - 5,061 = 104,049 
lu 2 = 445,314 - 5,061 2 = 419,314 
Zuv = 391,281 - 5,061x4,977 = 366,092 


Zv = 95,577-4,977 = 90,600 
Iv 2 = 345,426 - 4,977 2 = 320,655 
n = 27 - 1 = 26 


r 


uv 


_Z uv ~(Z u ~Z v V n _ 

-d u )7 n )(I v! -(Iv) 2 /n) 



366,092 - 


104,049x90,600 

26 


419,314- 


104,049 

26 


2 \ 


^320,655- 90,600 ^ 


V 


26 


y 


0,870. 


c) Como o ponto correspondente a São Paulo está perfeitamente coerente com a re¬ 
lação de dependência linear entre as variáveis u e v, a sua retirada fez com que 
houvesse até uma ligeira queda no valor do coeficiente de correlação. 


EXERCÍCIOS PROPOSTOS 

2.1_P) O Diagnóstico de Psicose depende do sexo do paciente? 

Use os dados da Tabela 8.5 para analisar a interdependência entre as variáveis Diag¬ 
nóstico de Psicose e Sexo do Paciente. Para isso: 

a) Obtenha uma tabela com os percentuais de linha (Diagnóstico de Psicose) para 
cada sexo. 

b) Obtenha uma tabela com os percentuais de coluna (Sexo) para cada diagnóstico 
de psicose. 

c) Interprete os resultados. 
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2-2_P) Alunos de diferentes cursos opinam sobre a qualidade do ensino 

Foi realizada uma pesquisa de opinião na qual 100 alunos de uma certa universidade 
opinaram sobre diversos assuntos. A tabela de contingência a seguir mostra o cruzamento 
entre as variáveis “Área de conhecimento do curso” e “Avaliação da qualidade do curso”. 


Avaliação da Qualidade do Curso 


Área de conhecimento do curso 

Satisfeito 

Insatisfeito 

Total 

Biomédica 

22 

8 

30 

Humanas 

10 

20 

30 

Tecnológica 

28 

12 

40 

Total 

60 

40 

100 


a) Considerando o total de respondentes que se declararam insatisfeitos com o seu 
curso, que percentual destes são da área biomédica? 

b) Considerando o total de respondentes que não pertencem à área tecnológica, 
que percentual destes estão satisfeitos com o seu curso? 

2.3_P) Moças e rapazes opinam sobre o aborto 

Foi realizada uma pesquisa por amostragem entre os jovens de uma certa região do 
país visando conhecer as suas posições a respeito da legalização do aborto. Os resulta¬ 
dos principais estão apresentados sob a forma da seguinte tabela de contingência: 


Posicionamento quanto à legalização do aborto 


Sexo 

Favoráveis 

Contrários 

Total 

Masculino 

40 

10 

50 

Feminino 

30 

20 

50 

Total 

70 

30 

100 



Para cada uma das afirmações a seguir, classifique-a como Verdadeira ou Falsa e jus¬ 
tifique a sua resposta. 

a) A proporção de rapazes entre os que se declararam favoráveis ao aborto é de 
0,80. 

b) Sorteando ao acaso uma dessas 100 pessoas, a probabilidade de que ela seja uma 
moça ou seja favorável ao aborto é igual a 0,6. 

c) Menos de 30% das moças são contrárias ao aborto. 

2.4 P) Oporlunidades de treinamento vistas por gerentes e não gerentes 

Foi realizada uma pesquisa de Clima Organizacional na Empresa X. Para isso foram 
ouvidos 350 empregados sobre lemas os mais variados. A empresa como um todo tem 
cerca de 8.000 empregados, dos quais 223 ocupam cargos gerenciais. Com relação às 
oporlunidades de ireinamento que a empresa oferece, vistas por gerentes e não geren¬ 
tes os resultados lotam sintetizados na tabela a seguir. 
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Avaliação das Oportunidades de Treinamento 


Situação Funcional 

Número de Entrevistas 

Péssimas 

Ruins 

Médias 

Boas 

Ótimas 

Gerentes 

15 

0% 

6,67% 

0% 

33,33% 

60,00% 

Não Gerentes 

335 

21,79% 

24,18% 

22,39% 

19,07% 

1 1,94% 


Quais das seguintes afirmações estão corretas e quais não estão? Por quê? 

a) Como nesta amostra o contingente de empregados que ocupam cargos de gerên¬ 
cia é excessivamente reduzido (somente 15), os percentuais calculados que es¬ 
tão na linha da tabela correspondente aos gerentes não são estatisticamente sig¬ 
nificativos. 

b) De uma forma geral, os gerentes da empresa X tendem a estar muito satisfeitos 
com as oportunidades de treinamento que a empresa oferece. 

c) Considerando a empresa como um todo, 71,94% dos empregados entrevistados 
avaliaram como ótimas as oportunidades de treinamento que a empresa oferece. 

d) Considerando a empresa como um todo, cerca de 10% dos empregados conside¬ 
ram péssimas as oportunidades de treinamento que a empresa oferece. 

e) Os resultados fornecidos não são coerentes porque a soma dos dois percentuais 
em cada uma das cinco últimas colunas da tabela deveria ser 100%. 

2.5_P) Peso versus altura 

Os dados a seguir se referem a uma amostra de oito pessoas para as quais se dispõe de 
informações relativas a: 

• Nome 

• Altura (em metros) 

• Peso (em quilos) 


Nome 

Altura 

Peso 

Jorge 

1,89 

73 

Diva 

1,74 

68 

André 

1,93 

82 

Lucia 

1,74 

57 

Silvio 

1,78 

126 

Pedro 

1,92 

90 

Maria 

1,61 

53 

Norma 

1,8 

65 


a) Para a variável Altura, calcule a média e o desvio-padrão. 

b) Para a variável Peso, calcule a média e o desvio-padrão. 

c) Calcule a correlação entre as variáveis Peso e Altura, e trace a reta de regressão, 
sendo Altura a variável independente e Peso a variável dependente. 

d) Repita o que foi feito no item anterior excluindo da amostra a pessoa de nome 
Silvio. 

e) Que conclusões podem ser extraídas dos itens (c) e (d)? 
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2.6_P) Número de alunos versus número de professores em universidades 
brasileiras 

A tabela a seguir fornece o número total de alunos e o número total de professores 
em 1982 para as principais universidades dos quatro estados “mais ricos” do Brasil 
(MG, RJ, RS, SP). 



Universidade 

Alunos 

Professores 

PUC de Minas Gerais 

13.147 

713 

Federal de Juiz de Fora 

6.606 

781 

Federal de Minas Gerais 

23.759 

2.194 

Federal de Ouro Preto 

1.106 

178 

Federal de Uberlândia 

6.651 

765 

Federal de Viçosa 

5.842 

667 

PUC do Rio Grande do Sul 

23.045 

1.459 

Católica de Pelotas 

5.711 

381 

Univ. de Caxias do Sul 

9.196 

497 

Federal de Pelotas 

4.877 

903 

Federal do Rio Gde. do Sul 

16.985 

2.451 

Federal de Santa Maria 

9.693 

1.362 

Univ. de Passo Fundo 

7.450 

530 

Univ. do Rio Grande 

3.476 

490 

Univ. do Vale do Rio dos Sinos 

21.000 

650 

PUC do Rio de Janeiro 

8.232 

788 

Católica de Petrópolis 

4.200 

298 

Estadual do Rio de Janeiro 

1 1.000 

1.750 

Federal Fluminense 

24.775 

2.415 

Federal do Rio de Janeiro 

30.000 

3.580 

Federal Rural do RJ 

3.686 

61 1 

Gama Filho 

26.000 

1.541 

PUC de Campinas 

18.132 

1.457 

PUC de São Paulo 

15.296 

1.526 

Estadual de Campinas 

9.843 

1.474 

UNESPJulio Mesquita Filho 

14.204 

2.395 

Federal de São Carlos 

2.566 

463 

Univ. Mackenzie 

14.022 

121 

Univ. de Mogi das Cruzes 

15.088 

924 

Estadual de São Paulo 

44.159 

4.461 

Metodista de Piracicaba 

6.600 

500 


Fonte : Almanaque Abril 1985 


a ) Calcule o coeficiente de correlação entre essas duas variáveis e extraia as conclu¬ 
sões cabíveis. 

b) Calcule os coeficientes da reta de regressão que expressa a variável Número de 
Professores como função linear da variável Número de Alunos. 

c) Como você interpretaria o significado de cada um dos coeficientes da reta de re¬ 
gressão? 
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Obs.: Sabe-se que n = 31 x = I 3108 y = 1236 
5>, - x)(yi - y) = 2,443x 10 H 

t=i 

^(x. -x) 2 =2,793x 10 9 £(yi -y) 2 =3,052 x 10 7 

i=l i=l 


2.7_P) A relação entre regressão e correlação 

Quando se ajusta um modelo de regressão linear simples onde y é a variável a expli¬ 
car e x é a variável explicativa, se r é o valor do coeficiente de correlação entre x e y. 

a) Quanto mais próximo r estiver de 1, mais próximos os pontos estarão da reta de 
regressão. Certo ou errado? Por quê? 

b) O valor de r depende do ângulo formado pela reta de regressão com o eixo hori¬ 
zontal. Certo ou errado? Por quê? 

c) Se r for igual a (ou próximo de) zero, isso significa que não existe relação de de¬ 
pendência entre x e y. Certo ou errado? Por quê? 

d) r pode assumir qualquer valor real entre -oo e +co. Certo ou errado? Por quê? 

2.8_P) Hemoglobina versus hematócrito 

Na Unidade de Pesquisa sobre Choque da Universidade de Southern Califórnia, Los 
Angeles, Estados Unidos, foram coletados dados sobre variáveis fisiológicas no mo¬ 
mento em que cada paciente foi admitido. Os dados se referem a uma amostra com n = 
37 pacientes, e somente algumas das medições efetuadas foram aqui consideradas. 
Aqui estão os dados: 

TABELA - Dados da pesquisa sobre choque 


Hgb 

Hct 

Hgb 

Ha 

Hgb 

Ha 

Hgb 

Ha 

134 

41,0 

103 

31,0 

122 

43,0 

157 

47,0 

93 

28,0 

85 

28,0 

1 19 

32,0 

121 

38,0 

130 

39,0 

97 

29,0 

97 

31,0 

133 

41,0 

100 

31,0 

152 

48,0 

79 

24,0 

106 

32,0 

133 

41,0 

100 

30,0 

100 

30,0 

143 

43,0 

133 

42,0 

99 

30,0 

96 

29,0 

136 

39,0 

105 

27,0 

123 

36,5 

67 

20,0 

90 

27,0 

136 

38,0 

125 

42,5 

91 

27,0 



98 

30,0 

130 

40,3 

105 

31,5 



77 

25,0 

137 

41,5 

99 

30,0 




Fonte: Afifi e Azen. "Statistical Analysis, a Computer oriented approach”, Academic Press, 1972. 


a) Analise através do coeficiente de correlação o grau de dependência linear entre 
as variáveis x = Hct (Hematócrito, expressa em percentagem) e y = Hgb (Hemo¬ 
globina, expressa em grama). 

b) Expresse a variável Hgb (Hemoglobina) como Hgb = a + b Hct + erro, onde Hct = 
Hematócrito. Quais seriam os valores de a e b calculados através do método de 
mínimos quadrados, e qual o significado do coeficiente b? 
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c) Com base nesse ajuste linear, qual se esperaria que fosse o valor da variável He¬ 
moglobina para um paciente com Hematócrito = 34,7%? Por quê? 


2.9_P) Segurança revisitada 

O objetivo deste exercício é mostrar como o uso da transformação logarítmica foi re¬ 
almente importante no Exercício 2.3_R. 

Usando novamente os dados do Exercício 2.3_R: 

a) Obtenha o diagrama de dispersão de y contra x. 

b) Calcule o coeficiente de correlação entre as variáveis originais x e y, com e sem 
São Paulo. 

c) Compare os resultados obtidos com os do Exercício 2.3_R. 

d) Extraia conclusões. 

São fornecidos: 

Dx = 476935 Dy = 223220 

Dx 2 = 21806963991 Dy 2 = 10297903782 Dxy = 14095901292 

2.10_P) A argilosidade depende do tipo de solo? 

Observação: Este exercício envolve a relação de dependência entre uma variável 
qualitativa (tipo de solo) e uma variável quantitativa (argilosidade). Ele deve ser resol¬ 
vido com o uso do computador. 

O arquivo de dados Argilosidade.xls considera m = 4 diferentes tipos de solo: B, D, E e 
G. O arquivo contém um total de 541 observações, sendo que cada uma corresponde a 
uma localidade (caracterizada por latitude, longitude e profundidade). Para cada uma 
delas foram obtidas medições de propriedades físicas e geológicas do solo em diferentes 
localizações de uma região rica em petróleo. A variável que nos interessa aqui é a pro¬ 
priedade chamada Argilosidade. 

Utilizando um software estatístico apropriado: 

a) Faça uma contagem do número de observações correspondente a cada um dos 
quatro tipos de solo e, com base nos resultados, obtenha um gráfico de setores 
correspondente à variável tipo de solo. Extraia as conclusões cabíveis. 

b) Construa um gráfico em que apareçam quatro boxplots da variável Argilosidade, 
sendo um para cada tipo de solo. Extraia as conclusões cabíveis. 


CAPÍTULO 


3 


INTRODUÇÃO AO CÁLCULO 
DE PROBABILIDADES 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Experimento aleatório — Espaço amostrai — Evento — Probabilidade 

• Eventos mutuamente exclusivos 

• Probabilidade condicional - Teorema de Bayes 

• Eventos independentes 

• Regra da soma e regra do produto 

Considere as seguintes situações: 


/) João vai passar um fim de semana no Rio de Janeiro e quer saber se, na sua bagagem, precisa 
levar o guarda<huva. Liga a TV, dá uma olhada no informe meteorológico do noticiário e obser¬ 
va que haverá céu encoberto com possíveis chuvas. Como ele acredita no que diz a “moça do 
tempo”, conclui que há uma probabilidade grande de chover. Embora não tenha condições de 
quantificar essa probabilidade, João opta por levar o guarda<huva. 

2) Maria deseja fazer uma cirurgia plástica com o Dr. Pedro, mas, antes de tomar a decisão de se 
submeter a essa intervenção, gostaria de saber a chance de ser bem-sucedida. 

3) Luisa quer se inscrever num concurso, no qual será examinada sobre um tópico a ser sorteado 
de uma lista de dez. Ela conhece muito bem o conteúdo de três desses tópicos, porém é absolu¬ 
tamente ignorante nos tópicos restantes. Ela deseja saber quão grande é a sua chance de ser 
aprovada. 

Em todos esses casos, o interesse é conhecer a probabilidade de um dado evento ocorrer, di¬ 
ante da necessidade de tomar uma decisão: levar ou não o guarda-chuva, fazer ou não a cirurgia 
plástica, inscrever-se ou não no concurso. Ainda mais: João só sabe que há grande probabilidade 
de chover porque o informe do tempo prognosticou chuva. Maria pode ter um valor estimativo 
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para a probabilidade de sucesso na sua cirurgia plástica, mas será apenas uma aproximação. 
Luisa parece ser a única capaz de quantificar exatamente a probabilidade de ser bem-sucedida 
na prova do concurso. 

E se a situação for um pouco mais complexa, como a seguir? 

4) Em um concurso público, uma das provas constava de 80 questões de múltipla escolha, sendo 
que cada questão admitia cinco opções possíveis de resposta. Os candidatos Ae 8 marcaram 
exatamente a mesma opção de resposta em 70 dessas questões, sendo que entre essas ape¬ 
nas 60 estavam corretas. Será que houve cola? (Veja o Exercício Resolvido 3.I_R) 


O Cálculo de Probabilidades é uma ferramenta útil para nos ajudar a responder tais 
perguntas. 

Como uma iniciação ao mundo das probabilidades, veja como você responderia a 
perguntas simples, como as do Exemplo 3.1 a seguir. 

EXEMPLO 3.1: Moedas, dados, baralhos... 

Qual a chance de se obter: 

a) Uma cara no lançamento de uma moeda? 

b) Um seis no lançamento de um dado? 

c) Um número par no lançamento de um dado? 

d) Um rei de paus, retirando uma carta ao acaso de um baralho completo (sem co- 
ringa)? 

e) Um rei, retirando uma carta ao acaso de um baralho completo (sem coringa)? 


3.1 ALGUNS CONCEITOS FUNDAMENTAIS 
O que é probabilidade? 

Para responder às perguntas anteriores, é importante vermos antes os conceitos de ex¬ 
perimento aleatório, espaço amostrai e evento. 


Experimento aleatório - é um experimento no qual podemos descrever o con¬ 
junto de todos os resultados possíveis, mas não podemos dizer, a priori, qual des¬ 
ses resultados vai aconlecer. 

Espaço amosiral - é o conjunto de todos os possíveis resultados do experimento 
aleatório. Sera denotado por íi. (Dizemos que o espaço amostrai é finito uniforme 
se ele tem um número finito de elementos, sendo lodos eles igualmente prováveis.) 
Evento é um subconjunto do espaço amostrai. Geralmente e denotado por uma 
letra maiuscula: A, B, C etc. 










72 ESTATÍSTICA BÁSICA 


fíLSEVíFR 


EXEMPLO 3.1 Moedas, dados, baralhos... (cont.): 

(a) Experimento aleatório - lançamento de uma moeda. 

Espaço amostrai - é formado por dois elementos: cara e coroa. 

Evento - sair cara. 

(b) e (c) Experimento aleatório - lançamento de um dado. 

Espaço amostrai - é formado por seis elementos {1,2,3,4,“5,6}. 

No item (b) o evento é ocorrer o número 6. 

No item (c) o evento é ocorrer um número par, ou seja, {2,4,6}. 

(d) e (e) Experimento aleatório - retirada de uma carta do baralho completo (sem co- 
ringa). 

Espaço amostrai - é formado por 52 elementos, cada um correspondente a 
uma das cartas do baralho completo (sem coringa). 

No item (d) o evento é retirar um rei de paus. 

No item (e) o evento é retirar um rei. 


Como definir o que seja a probabilidade de um evento A ocorrer? 


Conceito Clássico de Probabilidade 

Seja Q um espaço amostrai finito uniforme e seja A um evento qualquer desse es¬ 
paço. A probabilidade de A, denotada por P(A), é dada por 


P(A) = 


ff (A) 

#(Q) 


onde #(Í2) é o número de resultados possíveis do experimento e #(A) é o número 
de resultados favoráveis à ocorrência do evento A. É claro que 0 < P(A) < 1. 


EXEMPLO 3.1 Moedas, dados, baralhos... (calculando as probabilidades) 


a) A = sair cara no lançamento de uma moeda. Então P(A) = — 

2 


b) A = ocorrer o número 6 no lançamento de um dado. Então P(A) = - 

6 

c) A = ocorrer um número par no lançamento de um dado, ou seja A= {2,4,6}. 

Então P(A) = — = — 

6 2 

d) A = retirar um rei de paus de um baralho completo (sem coringa). Então 

P(A)= — 

52 

e) A = retirar um rei de um baralho completo (sem coringa). Então 

P(A) = —= — 

52 13 
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Exercitando: 

Na situação (3) do início do capítulo, qual seria a probabilidade de Luisa ser bem-suce¬ 
dida na prova? 

Outra maneira de atribuirmos probabilidades a eventos é através do conceito fre- 
qüentista de probabilidade. 


Conceito Freqüentista de Probabilidade 

Suponha que o experimento foi repetido n vezes, sempre sob as mesmas condi¬ 
ções, e que o evento A ocorreu m vezes entre essas n realizações do experimento. 
Então a fração m/n é uma boa aproximação para a probabilidade de A, se o núme¬ 
ro n de repetições for bastante grande. 

Simbolicamente, P (A) = — . 

n 



Consideremos novamente as situações (1) e (2) descritas na abertura do capítulo. 

A situação de Maria não parece ser tão complicada. Aqui o espaço amostrai tem dois 
resultados possíveis: a cirurgia pode ser bem-sucedida ou malsucedida. Um estatístico 
consultado examina o histórico de cirurgias plásticas executadas pelo Dr. Pedro e de¬ 
termina a proporção de cirurgias bem-sucedidas. Essa proporção fornece um valor 
aproximado para a probabilidade a ser quantificada. É o enfoque freqüentista. Ou seja, 
a probabilidade de sucesso é calculada (aproximadamente) dividindo o número m de 
cirurgias bem-sucedidas pelo número n de cirurgias realizadas. 

O mesmo enfoque pode ser usado no caso de João. Aqui talvez o mais certo fosse exa¬ 
minar o histórico das previsões diárias feitas durante vários anos para a mesma época 
do ano, observando quantas vezes a previsão de “chuvas” resultou efetivamente em 
chuva. 

EXEMPLO 3.2: Simulando 100 lançamentos de uma moeda 

Usando o software R, foram simulados 100 lançamentos de uma moeda equilibrada, 
isto é, em que as chances de cara e de coroa são iguais. Depois de cada lançamento, foi 
anotado o número acumulado de caras obtidas até esse momento e foi calculada a pro¬ 
porção de caras correspondente. Na tabela a seguir estão apresentados os valores cor¬ 
respondentes ao número acumulado de caras ao longo do processo. Por exemplo, para 
a jogada de número 29, o número acumulado de caras é 13 e a fração de caras é 13/29. O 
gráfico a seguir mostra a evolução dessa fração à medida que foram feitos os 100 lança¬ 
mentos da moeda. 

Observe que no começo há uma grande variabilidade do valor da probabilidade esti¬ 
mada m/n, mas ele tende a se estabilizar em 0,5 quando o número n de tentativas vai au¬ 
mentando. Esta é uma propriedade de lodo experimento aleatório, chamada estabilidade 
rslatistiícr a medida que o numero n de realizações do expei imenio aumenta, a probabili¬ 
dade empírica de um dado evento lende a se estabilizar em urna constante. 





74 ESTATÍSTICA BÁSICA 


RÍ.SHVÍER 




FIGURA 3.1 Cara ou coroa? A visão freqüentista. 


Observe que o “ponto de estabilidade” - a saber, 0,5 - corresponde ao valor que seria 
obtido para a probabilidade de cara, ao usarmos o conceito clássico de probabilidade no 
espaço amostrai finito uniforme (cara, coroa). 


O conceito freqüentista é até mais abrangente do que o conceito clássico de probabi¬ 
lidade, já que ele se aplica, mesmo quando o espaço amostrai não é finito uniforme. Po¬ 
rém, embora o conceito freqüentista nos forneça uma maneira de medir na prática a 
probabilidade de ocorrência de um determinado evento, sua aplicabilidade também 
não é assim tão ampla como gostaríamos que ela fosse. É claro que existem situações em 
que faz todo sentido pensarmos em atribuir um valor à probabilidade de algo ocorrer, 
embora não seja possível determinarmos empiricamente esse valor. 

Assim, além dos enfoques clássico e freqüentista, há também uma terceira forma de 
se conceituar o que seja a probabilidade de ocorrência de um determinado evento A: é o 
chamado enfoque Bayesiano. Segundo essa abordagem, a probabilidade de A acontecer 
refletiría o grau de confiança do observador quanto à ocorrência ou não do evento em 
questão. Assim sendo, na visão Bayesiana, probabilidade não seria um conceito objeti¬ 
vo, e sim um conceito subjetivo. 

Qualquer que seja o conceito de probabilidade adotado, as propriedades a seguir 
mantêm a sua validade. 


3.2 PROPRIEDADES BÁSICAS DA PROBABILIDADE 

Como foi dito anteriormente, qualquer subconjunto do espaço amostrai é um evento. 
A cada evento A corresponde uma probabilidade P(A), onde 0 < P(A) < 1. 

O conceito de probabilidade goza de algumas propriedades, como as seguintes: 

a) P (Q) = 1. 

A probabilidade de ocorrência do evento certo, representado pelo próprio es¬ 
paço amostrai Q, é igual a 1. 

b) P(0) = O. 

A probabilidade de ocorrência do evento impossível, representado pelo con¬ 
junto vazio, é igual a 0. 
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c) Se os eventos A e B são mutuamente exclusivos, ou seja, não podem ocorrer si¬ 
multaneamente, então P(A ou B) = P(A)+P(B). 

Sob essa condição, a probabilidade de A ocorrer ou B ocorrer é a soma das 
probabilidades de A e de B. 

d) P(A ou B) = P(A) + P(B) - P(A e B). 

No caso geral, temos de descontar dessa soma a probabilidade de A e B ocor¬ 
rerem simultaneamente. 

e) P (A c ) = 1 - P (A). 

A probabilidade de A não ocorrer é igual a 1 - P(A). Observe que A c represen¬ 
ta o chamado evento complementar de A, isto é, o conjunto dos elementos do es¬ 
paço amostrai Q que não estão em A. 


EXEMPLO 3.3: Ilustrando as propriedades da probabilidade 

Propriedade (d) 

Experimento: Extração de uma carta do baralho 
Sejam os eventos A = rei e B = paus. 

Sabemos que, em um baralho de 52 cartas, existem 4 reis, logo P(A) = 4/52. Como 
também existem 13 cartas de paus, P(B) = 13/52. Contudo, existe o rei de paus que é 
contabilizado tanto em A como em B. Para o cálculo de P(A ou B) devemos descontar a 
probabilidade de A e B ocorrerem juntos, ou seja, P(A e B), cujo valor é 1/52, porque só 
há um rei de paus dentre as 52 cartas do baralho. 

Assim sendo, encontramos 

16/52 = P(A ou B) = P(A) + P(B) - P(A e B) = 4/52 + 13/52 - 1/52 
Propriedade (e) 

Experimento: Lançamento de um dado 
A = 5 ou mais pontos A c = 4 ou menos pontos 
4/6 = P (A c ) = 1 - P(A) = 1-2/6 

■ 

3.3 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA DE 
EVENTOS 

Se A e B são eventos que podem ocorrer em um dado experimento, a probabilidade 
condicional de B ter ocorrido, quando se sabe que A ocorreu, é representada por P(B|A). 
(Leia-se probabilidade de B dado A) 

EXEMPLO 3.4: Probabilidade condicional no lançamento de um dado 

Experimento: lançamento de um dado 

A = o resultado é um número ímpar 

B- no mínimo são obtidos 3 pontos 

Desejamos < ah ular P(A|B). A = | 1, 3, 5) e B ( 3, 4, 5, 6) 

Pa/a calcularmos P(A|B), devemos considerai lodos os resultados lavoraveis a A 
d, nm os resultados d< lí ou seja, os resultados comuns a A e lí. 
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A 


FIGURA 3.2 Alguns eventos possíveis no caso do lançamento de um dado 


Há apenas dois resultados nessas condições, 3 e 5. Assim, P(A|B) = 2/4. Isso significa 
que procedemos como se B fosse o novo espaço amostrai. 

Uma outra maneira seria calcular P(A|B) usando a seguinte propriedade das proba¬ 
bilidades condicionais: 


P(A | B) = 


P(A e B) 
P(B) 


Com efeito, P(A e B) = 2/6 e P(B) = 4/6. Daí, 


9 

P(A | B) = =2/4 

4/6 


Analogamente, ao determinar a probabilidade condicional de B dado A, raciocina¬ 
mos como se o novo espaço amostrai fosse A e olhamos para a parte de B que está em A. 


Assim sendo, P(B|A) = 


P(A e B) _ 2/6 
P(A) ~ 3/6 


= 2/3 


Probabilidade Condicional 

Dados os eventos A e B, temos: 

P(B I A) = P(A 6 B) , se P(A) > 0, 
P(A) 

assim como 


P(A I B) = P(A 6 B) , se P(B) > 0. 
P(B) 


Observação: Notemos que, se A está contido em B (notação: A c= B), então (A e B) = A e 

(A ou B) = B. Conseqüentemente, neste caso, P(A) < P(B), P(A| B) = P ^ e P(B IA) = 1 

P(B) 

Há situações nas quais uma probabilidade condicional pode ser calculada em forma 
direta sem usar as fórmulas anteriores, como no exemplo a seguir. 
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EXEMPLO 3.5: Extração de duas cartas do baralho sem reposição 

Experimento: Extração de duas cartas de um baralho em seqüência e sem reposição 
Dl = D carta é uma dama 
D2 = 2a carta é uma dama 

Aqui é fácil ver que P(D1) = 4/52. Se sabemos que uma dama foi obtida na primeira 
extração, para a segunda extração restam 51 cartas das quais três são damas. Assim sen¬ 
do, P(D2|D1) = 3/51. 

Por outro lado, se é sabido que a primeira carta não foi dama, para a segunda extra¬ 
ção há quatro damas dentre as 51 cartas que restam e, portanto, P(D2|D1 C ) = 4/51. 



Da definição de probabilidade condicional, temos que 

P(A e B) = P(A|B) P(B) = P(B|A)P(A). 

Uma propriedade importante das probabilidades condicionais é o chamado Teore¬ 
ma de Bayes. Para motivar a sua apresentação, comecemos com um exemplo. 


EXEMPLO 3.6: E se a peça for defeituosa? 

A empresa X compra peças de três fornecedores A,, A 2 e A 3 nas proporções de 50%, 
30% e 20%, respectivamente. Sabe-se que, em média: 

5% das peças fabricadas por A[ apresentam defeitos. 

2 % das peças fabricadas por A, apresentam defeitos. 

1% das peças fabricadas por A 3 apresentam defeitos. 

Se uma peça é extraída ao acaso do estoque de X: 

a) qual a probabilidade de que ela seja defeituosa? 

b) qual a probabilidade condicional de que ela tenha sido produzida pelo fornece¬ 
dor A h dado que é defeituosa, i = 1,2,3? 

Se não soubéssemos se a peça sorteada é ou não defeituosa, diríamos que as chances 
de ela ser proveniente de A,, A 2 ou A 3 seriam 50%, 30% e 20%. Será que o fato de saber¬ 
mos que essa peça é defeituosa altera as nossas expectativas? 



FIGURA 3.3 Peças perfeitas ou defeituosas? O espaço amostrai e os eventos. 
Solução: 

a) Noiemos que uma peça defeituosa pode vii de A,, A, ou A,. Seja D o evento “A 
peça c deleiluosa’ I ntao: D (1) e A t ) ou (1) e A,) ou (De A 3 ). I omoesseseven 
tos sao iiiuluainente exclusivos 2 a 2, 

P(D) = P(D e A,) i Píl) e A,) t PÍD e A,) 
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= P(D|A,)P(A,) + P(D|A 2 )P(A 2 ) + P(D|A,)P(A,). 

Do enunciado do problema sabemos que: P(A,)=0,5, P(A 2 )=0,3, PfA- } )=0,2 e 
também P(D|A,)=0,05 ; P(D|A 2 )=0,02 e P(D|Aj)=0,0l 


Assim: P(D) = 0,05 x 0,5 + 0,02 x 0,3 + 0,01 x 0,02 = 0,033 ou 3,3%. 


b) Notemos que, para i= 1,2 e 3, então P(AJD) = 
Assim, 


P(A i e D) 

P(D)~ 


P(D| A, )PfA ,) 
P(D) 


P(AJD) 

P(A 2 |D) 


0,05x0,5 
0,033 
0,02 x 0,3 
0,033 


0,76 

0,18 


P(A,|D) 


0,01x0,2 

0,033 


0,06 


Conclusão: Pelo fato de sabermos que a peça extraída é defeituosa, as chances que 
atribuímos a cada um dos fornecedores A,, A 2 e A 3 de tê-la fabricado não são mais de 
50%, 30% e 20%, e sim de 76%, 18% e 6%, respectivamente. ■ 


A situação considerada no problema anterior pode ser generalizada, através de dois 
teoremas conhecidos do Cálculo de Probabilidades: 

• Teorema da Probabilidade Total 

• Teorema de Bayes 

os quais enunciamos a seguir. 

Para isso, começaremos pela definição do que seja uma partição do espaço amostrai: 


Dizemos que os eventos A,,A 2 ,....,A m formam uma partição do espaço amostrai Q se 
as seguintes condições são todas satisfeitas: 

• P(A,) > 0 para todo i, i=l,2,...,m 

• P(Aj e Aj) = 0, se i * j 

• P(A, ou A 2 ou...ou A m ) = 1 


Teorema da Probabilidade Total 

Se os eventos A lf A 2 ,....,A m formam uma partição do espaço amostrai Q e B é um 
outro evento qualquer desse espaço então: 

P(B) = P(BlAj) P(Aj) + ... + P(B|AJ P(A m ). 


Pergunta: 

Quanto seria P(D2) no caso do Exemplo 3.5? Por quê? 









ELSEVTER 


INTRODUÇÃO AO CÁLCULO DE PROBABILIDADES 79 


Teorema de Bayes 
Sob as mesmas condições, 


p, a ™ P(B|A. )P(A i ) . J . , , 

PfAJB) =-— , para todo 1 = 

P(B) 

onde P(B) é calculado usando-se o Teorema da Probabilidade Total. 


Observação: Analisando com atenção o enunciado do Teorema de Bayes, vemos que: 

• O fato de sabermos que o evento B ocorreu de fato pode alterar as nossas expectati¬ 
vas sobre a ocorrência dos A ( ’ s. 

• Quando se trata de probabilidades condicionais, ele nos permite inverter a ordem 
dos condicionamentos. 

• Pelo fato de A^A^...^ formarem uma partição do espaço amostrai, temos: 

P(A,) + P(A 2 ) + ... + P(AJ = 1 e P(AJB) + P(A 2 |B) + ... + P(AJB) = 1 


Eventos Independentes 

Dizemos que dois eventos A e B associados ao mesmo experimento são indepen¬ 
dentes se P (A e B) = P (A) . P(B) 


Observação: 

1. Se A e B são eventos independentes e tais que P(A) > 0 e P(B) > 0, então P(A|B) = 
P(A) e P(B|A) = P(B). Ou seja, neste caso o fato de sabermos que B ocorreu não 
altera as nossas expectativas sobre as chances de ocorrência de A, e vice-versa. 

2. Se A e B são eventos independentes, também o são A e B c , A c e B, A c e B c . 

EXEMPLO 3.7: Baralho - Independência de eventos 

Experimento: Extração de uma carta do baralho 
A = a carta é um valete B = a carta é de copas 

Como P(A e B) = 1/52 = (4/52) x (13/52) = P(A) . P(B), A e B são independentes. 
Observe também que P(A|B) = 1/13 = 4/52 = P(A) e 

P(B|A) = 1/4 = 13/52 = P(B). 

Curiosamente, se fossem acrescentados ao baralho dois coringas (Jokers), a inde¬ 
pendência entre A e B não existiria, já que nesse caso teríamos 

P(A|B) = 1/13*4/54 = P(A) e P(B|A) = 1/4 * 13/54 = P(B). 

■ 

3.4 SOMAR OU MULTIPLICAR PROBABILIDADES? 

Munas vezes, nos defrontamos com unta situação em que a ocorrência do evento C 
depende da ocorrência ou não dos eventos A e B. Digamos que as probabilidades de A e 
de B sejam < onhr< idas e que seja nosso objetivo calcular a probabilidade P(C). Em tais 
casos e d< se esperai que exisla uma relação malematica expressando P(C) em função 
de P(A) e 1TB). 
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EXEMPLO 3.8: Quatro situações no lançamento de dois dados 

Consideremos qualro situações simples que ilustram esse tipo de rac ioc ínio. 

Em todas elas o experimento considerado é o lançamento de dois ciados. 

Situação 1 

A = Obter no mínimo 7 no total de pontos dos dois dados 
B = Obter no máximo 3 pontos em cada dado 

C = Obter no máximo 3 pontos em cada dado ou no mínimo 7 no total de pontos dos 
dois dados = A ou B 



FIGURA 3.4 Lançamento de dois dados - Situação I. 


Aqui é fácil ver que: 

P(A) = 21/36, P(B) = 9/36 e P(C) = 30/36 = 21/36 + 9/36 = P(A) + P(B), 
porque A e B não podem ocorrer simultaneamente. 

Exercitando: Quanto seria P(AeB) neste caso? 

Situação 2 

A = ocorre um seis no l ü lançamento 
B = ocorre um seis no 2 2 lançamento 
C = o resultado é seis em ambos os lançamentos = A e B 
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FIGURA 3.5 Lançamento de dois dados - Situação 2. 
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Aqui, temos: 

P(A) = 1/6, P(B) = 1/6 e P(C) = 1/36 = 1/6 x 1/6 = P(A). P(B), 
porque não existe dependência entre os eventos A e B. 

Situação 3 

Tanto o experimento como os eventos A e B são os mesmos da Situação 2, mas 
C = ocorre um seis em pelo menos um dos dois lançamentos = A ou B. 



FIGURA 3.6 Lançamento de dois dados - Situação 3. 

Como antes, P(A) =P(B) = 1/6. Mas agora 

P(C) = — = — + — -IxI=P(A) + P(B)-P(AeB), 

36 36 36 6 6 

porque é possível A e B ocorrerem simultaneamente. 

Situação 4 

A = Obter no mínimo 7 no total de pontos dos dois dados 
B = Obter no máximo 4 pontos em cada dado 

C = Obter no máximo 4 pontos em cada dado e no mínimo 7 no total de pontos dos 
dois dados = A e B 



FIGURA 3.7 Lançamento de dois dados Situação 4 
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Pela figura, vemos que P(A) 



e P(C) = —. 

36 


Além disso, P(A|B) = — 


16 


e P(B|A) = — . 

21 


Logo 


21 3 3 

P(A) P(B|A) = — x — = — 


P(B) P(A|B) = 


16 3 3 


e 




36 21 36 


36 16 36 


Portanto, P(C) = P(A) P(B|A) = P(B) P(A|B), 

porque aqui existe interdependência entre os eventos A e B. 


Exercitando: Quanto seria P(AouB) neste caso? 

Perguntas: 

1. Por que na Situação 1 somamos as probabilidades de A e de B, enquanto na Situa¬ 
ção 2 as multiplicamos? Quando devemos somar e quando devemos multiplicar? 

Resposta: Soma-se no caso de “ou” e multiplica-se no caso de “e”. 

2. Essa é uma regra geral? Sempre que se trata de “ou” devemos somar e sempre 
que se trata de “e” devemos multiplicar? 

Resposta: Nem sempre, a coisa não é tão simples assim. Precisamos atentar 
para alguns detalhes, como veremos em seguida. 

3. Já que na Situação 3, C = (A ou B), por que P(C) não é igual a P(A) + P(B)? 

Resposta: Para podermos somar meramente as probabilidades de A e de B, é 
preciso que duas condições sejam atendidas: 

a) C = (A ou B); 

b) A e B sejam eventos mutuamente exclusivos. 

Ocorre que a segunda condição não é atendida na Situação 3, porque nesse 
caso os eventos A e B podem ocorrer simultaneamente. 

4. Já que na Situação 4, C = (A e B), por que P(C) não é igual a P(A).P(B)? 

Resposta: Para podermos multiplicar meramente as probabilidades de A e de 
B é preciso que duas condições sejam atendidas: 

a) C = (A e B); 

b) A e B são eventos independentes. 

Ocorre que a segunda condição não é atendida na Situação 4, porque nesse 
caso há dependência entre os eventos A e B. 

5. O que há de comum e o que há de diferente entre as Situações 1 e 3? 


Resposta: 


O que há de comum é que C = (A ou B) em ambas as situações, ou seja, trata-se 
de somar probabilidades em ambos os casos. 

O que há de diferente é que A e B são eventos mutuamente exclusivos na Si¬ 
tuação 1, mas isso não ocorre na Situação 3. 

Por isso, na Situação 3 tivemos de subtrair P(AeB) da soma P(A) + P(B) para 
chegar a P(AouB). 
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6 . O que há de comum e o que há de diferente entre as Situações 2 e 4? 

Resposta: 

O que há de comum é que C = (A e B) em ambas as situações, ou seja, trata-se 
de multiplicar probabilidades em ambos os casos. 

O que há de diferente é que A e B são eventos independentes na Situação 2, 
mas isso não ocorre na Situação 4. 

Por isso, na Situação 4, para podermos expressar P(AeB) como um produto, 
foi necessário recorrermos ao conceito de probabilidade condicional, ou seja, 
P(AeB) = P(A).P(B|A) = P(B).P(A|B). ■ 

Para melhor sistematizar o tipo de raciocínio que se utiliza em situações como as do 
exemplo anterior, é comum enunciarmos as propriedades chamadas regra da soma e 
regra do produto. Na verdade, elas não trazem nenhuma novidade em relação ao que já 
foi apresentado anteriormente. São somente maneiras úteis de reorganizar o nosso co¬ 
nhecimento e assim procurar facilitar a resolução de problemas que envolvam o cálculo 
de probabilidades. 


Regra da Soma: 

Dados os eventos A e B do mesmo espaço amostrai: 

P(AouB) = P(A) + P(B) - P(AeB) 

É claro que se A e B não têm elementos em comum, então P(AeB) = P(o) = 0 e nes¬ 
se caso a expressão se reduz a : P(AouB)=P(A)+P(B). 


Observação: A propriedade P(AouB) = P(A) + P(B) - P(AeB) pode ser generalizada 
para um número finito qualquer de eventos. Por exemplo, no caso de três eventos, temos: 
P(AouBouC) = P(A)+P(B)+P(C)-P(AeB)-P(AeC)-P(BeC)+P(AeBeC). 


Regra do Produto: 

Dados os eventos A e B do mesmo espaço amostrai Q: 


P(A e B) = < 


P(B) P(A|B), desde que P(B)>0 e 

P(A) P(B|A), desde que P(A)>0 
Observação: 

I) As condições P(A) >0 e P(B) > 0 são necessárias para que existam as proba¬ 
bilidades condicionais. 

1) Vimos na Seção 3.3 que se A e B são eventos independentes, então P(A|B) = 
\>(/\) i PÍB|Aj=P(Bj. Portanto, para eventos independentes, as expressões ante¬ 
riores reduzem se a P(AeB) = P(A).P(B). 


Vejamos agoia alguns exemplos em que sâo tileis as regias da soma e tio produto. 
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EXEMPLO 3.9: Vistoria de automóveis 

No Rio dejaneiro algumas condições são exigidas para que um automóvel seja apro¬ 
vado na vistoria anual obrigatória: 

• a emissão de gases poluentes deve estar abaixo do nível máximo tolerado; 

• as lanternas do veículo devem estar todas funcionando normal mente; 

• a data de validade do extintor de incêndio não pode estar vencida. 

Basta que uma delas não se cumpra para que o veículo não seja aprovado. Suponha 
que uma pessoa vai levar o seu carro para a vistoria. Como ela não teve o cuidado de ve¬ 
rificar todos esses detalhes, pode haver problema. Admita que as probabilidades de es¬ 
sas condições não estarem atendidas são: 10% (poluição), 15% (lanternas) e 20% 
(extintor). Supondo que tudo o mais esteja OK (documentação, impostos em dia, mul¬ 
tas pagas etc.): 

a) Qual a probabilidade de que o carro seja aprovado na vistoria? 

b) Qual a probabilidade condicional de que apenas uma das condições anteriores 
não tenha sido atendida, dado que o carro foi reprovado na vistoria? 

Solução: 

a) Consideremos os seguintes eventos: 

A = aprovação na vistoria P = controle de poluição OK 
L = lanternas OK E = extintor OK 

Para que A ocorra, é necessário que todos os três eventos P, L e E ocorram, ou 
seja, 

A = (P e L e E) 

Além disso, sabemos que P(P) = 0,90, P(L) = 0,85 e P(E) = 0,80. Então, 
pela regra do produto, devido à independência, 

P(A) = 0,90 x 0,85 x 0,80 = 0,612. 

b) Seja F1 = só houve uma falha. 

Sabemos que se F1 ocorrer, então A não ocorrerá, portanto, F1 c= A c . Além disso, 

F1 = (P c e L e E) ou (P e L c e E) ou (P e L e E c ). 


Como os três eventos que compõem o evento F1 são mutuamente exclusivos 2 a 2, 
pela regra da soma, a probabilidade de apenas uma das condições não ter sido atendida 
é igual à soma de suas probabilidades, ou seja, 

P(F1) = P(P C e L e E) + P(P e L c e E) + P(P e L e E c ). 

Além disso, pela regra do produto (no caso de independência), cada um desses 
três eventos tem sua probabilidade igual ao produto das probabilidades das três 
condições que o definem, isto é, 

P(F1) = P(P C )P(L)P(E) + P(P)P(L C )P(E) + P(P)P(L)P(E C ) 
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Finalmente, como F1 c A c , 


P(F1|A C ) = 


P(F1) 

P(A C ) 


_ 0,10 x 0,85 x 0,80 + 0,90 x 0,15 x 0,80 + 0,90 x 0,85 x 0,20 . 0/10 

—--= U,oTo 

1-0,612 

Pela observação que se segue imediatamente ao enunciado da regra da soma, vemos que 
a probabilidade de reprovação na vistoria pode também ser calculada de uma outra forma: 

P(Reprovação) = P(A C )= P(P c ouL c ouE c ) = 

= P(P c )+P(L c )+P(E c )-P(P c eL c )-P(P c eE c )-P(L c eE c )+P(P c eL c eE c )= 

= 0,10+0,15+0,20-0,10x0,15-0,10x0,20-0,15x0,20+0,10x0,15x0,20 = 0,388 = 

= 1-0,612= 1 - P(PeLeE) 

Note que a independência entre P, L e E foi usada repetidamente nesses cálculos. 


O exemplo a seguir ilustra o cálculo de probabilidades em uma situação do nosso co¬ 
tidiano. 


EXEMPLO 3.10: Tentando um contato telefônico 

Um executivo pediu à sua secretária que fizesse uma ligação para o escritório do Sr. 

X. Admitindo que: 

• a probabilidade de a secretária conseguir completar a ligação é 0,5; 

• a probabilidade do Sr. X se encontrar no escritório naquele momento é 0,8; 

• a probabilidade de o executivo não se ausentar da sala enquanto a secretária tenta 
fazer o que ele pediu é 0,9; 

a) calcule a probabilidade de que o executivo tenha de fato conseguido falar pelo 
telefone com o Sr. X. 

No caso de ele não ter conseguido falar com o Sr. X, calcule a probabilidade 
condicional de que isso tenha acontecido: 

b) porque a ligação não se completou; 

c) porque, embora a ligação tenha se completado, o Sr. X estava ausente naquele 
momento; 

d) porque, embora a ligação tenha se completado e o Sr. X estivesse presente na¬ 
quele momento, o executivo sumiu enquanto a secretária tentava fazer o que ele 
pediu. 

Solução: 

Sejam 

( a ligação se completou 

P - o Sr, X estava presente 

I o < x< < ulivo licou na sala enquanto a secretaria tentava ligai 

S su< i sso (o cxei uii vo t ouseguiu lalat com o Si X) 
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A figura a seguir é uma tentativa de representar o problema soba íorma d< unia arvo¬ 
re. Esse tipo de representação costuma ser muito útil para nos ajudar a racio< iriar (pian¬ 
do se trata de probabilidades condicionadas. 



FIGURA 3.8 Tentando um contato telefônico - Árvore descritiva do problema 


Para que S ocorra é necessário que todos os três eventos C, P e F ocorram, ou seja: 
S = (C e P e F) 


a) Como C, P e F são independentes, pela regra do produto, 
P (S) = P(C). P(P). P(F) = 0,5 x 0,8 x 0,9 = 0,36 


b) 


Aqui o que se deseja calcular é P(C C | S c ), o que é o mesmo que 


P(C c eS c ) 
P(S C ) 


Já vimos que, se C não ocorrer, então S também não poderá ocorrer, ou seja, 
C ( c S c; . Portanto, P(C C e S c ) = P(C C ). Então: 


p(f ricr 1 P(C c eS c ) P(C C ) _ 1-0,5 
P(S C ) P(S C ) 1-0,36 


0,5 

0,64 


= 0,781 


c) Aqui, o que se deseja calcular é P(CeP c | S c ). E, como (CeP c ) c S c , 


P(C e P c I S c ) = 


P(CeP c ) _ P(C)- P(P c ) _ 0,5x (1 -0,8) 
P(S C ) P(S C ) 0,64 


= 0,156 


d) O que se deseja calcular é P(C e P e F c | S c ). E, como (C e P e F c ) c S c 
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P(C e P e F c | S c ) = 

P(C e P e F c ) P(C) • P(P) • P(F c ) _ 0,5 x 0,8 x (1 -0,9) _ Q63 
P(S C ) P(S C ) " 0,64 

Concluímos então que a probabilidade de sucesso é 36%. Por outro lado, no caso de 
um fracasso, as chances de que a sua explicação seja “ligação não completada”, “Sr.X 
ausente” e “executivo sumido” são, respectivamente, 78,1%, 15,6% e 6,3%. 

Observação: 

1. Nos itens (c) e (d), usamos novamente a regra do produto (no caso de indepen¬ 
dência). 

2. Note que: 

• S c = C c ou (CeP c ) ou (C e P e F c ) e 

• Os eventos C c , (C e P c ), (C e P e F c ) são mutuamente exclusivos, 2 a 2. 
Então, pela regra da soma: 

P(S C ) = P(C C ) + P(CeP c ) + P(C e P e F c ) = 0,50 + 0,10 + 0,04 = 0,64. 

Além disso, 

P(C c |S c )+P(CeP c |S c )+P(CePeF c |S c ) = 0,781+0,156+0,063 = 1. ■ 

O Exercício Resolvido 3.3_R ilustra o uso da regra do produto em uma situação em 
que não há independência entre os eventos considerados. 


RESUMO DO CAPÍTULO 3 

• No estudo do cálculo de probabilidades, os três termos a seguir aparecem com 
muita frequência: 

Experimento aleatório - é um experimento no qual podemos descrever o con¬ 
junto de todos os resultados possíveis, mas não podemos dizer, a priori, qual 
desses resultados vai acontecer. 

Espaço amostrai - é o conjunto de todos os possíveis resultados do experimen¬ 
to aleatório, (denotado por Q) 

Evento - é um subconjunto do espaço amostrai (comumente denotado por 
uma letra maiúscula: A, B, C etc). 

• A cada evento A corresponde uma probabilidade P(A), onde 0 < P(A) < 1. 

• Dado o evento A, a probabilidade de A ocorrer pode ser definida como 

P(A) = onde #(A) representa o número de resultados favoráveis a A e 

#(H) 

tí(Ll) o número de elementos de fl (Conceito clássico, aplicável quando o es¬ 
paço amostrai íl é finito uniforme) 

• ( íuira forma de definir probabilidade e através da frequência relativa: se um 
experimento e repelido n vezes e o evento A ocorre m vezes (entre as n), então 

p(A) Ml se n foi iniiiio grande. (( onceilo Ircqúenlisla) 
n 
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• Propriedades da probabilidade: 

a) P (Q) = 1. 

b) P(0) = O. 

c) A c representa o evento complementar de A se a ocorrência A implica na não 
ocorrência de A c e vice-versa. Então P (A c ) = 1 - P (A). 


Sejam A e B eventos quaisquer associados a um mesmo espaço amostrai. Então: 


P(A ou B) = P(A) + P(B) - P(A e B). 

Os eventos A e B são mutuamente exclusivos se eles não puderem ocorrer simul¬ 
taneamente. Conseqüentemente, se A e B são mutuamente exclusivos, então 
P(AeB) = 0 e P(A ou B)= P(A) + P(B). 

O símbolo P(B|A) representa a probabilidade condicional de B ter ocorrido, 

p(A e B) 

quando se sabe que A ocorreu. P(B|A) = 


P(A) 


-, se P(A) > 0. 


P(A e B) = P(A|B) P(B) = P(B|A)P(A). 

Os eventos A 1 ,A 2 ,....,A m formam uma partição do espaço amostrai Q. se um e 
somente um entre eles ocorre. 

Teorema da Probabilidade Total: Se os eventos A^A^....^ formam uma parti¬ 
ção do espaço amostrai QeBé um outro evento qualquer desse espaço, então: 
P(B) = PCBlA.jPCA,) + ... + P(B|AJP(AJ. 

Teorema de Bayes: Se os eventos A 1 ,A 2 ,....,A m formam uma partição do espaço 

P(B| A f )P( A f ) 


amostrai Q, então P(AJB) = 


P(B|A 1 )P(A 1 )+...+ P(B|A m )P(AJ 


, para todo i = 


l,2,...,m 

• A e B são eventos independentes se P(A e B) = P (A). P(B). Nesse caso, P(A|B) = P(A) 
e P(B|A) = P(B). 

• Alguns dos resultados apresentados podem ser reformulados através das cha¬ 
madas regra da soma e regra do produto, cujo enunciado pode ser consultado 
na teoria deste capítulo. 


EXERCÍCIOS RESOLVIDOS 

3.1_R) Suspeita de cola em concurso público 

Em um concurso público, uma das provas constava de 80 questões de múltipla esco¬ 
lha, sendo que cada questão admitia cinco opções possíveis de resposta. Os candidatos 
X e Y marcaram exatamente a mesma opção de resposta em 70 dessas questões, sendo 
que entre essas apenas 60 estavam corretas. Admita que: 

• Qualquer candidato só erra uma determinada questão quando ele realmente não 
sabe resolvê-la. 

• Qualquer candidato que não pratique a “cola”, ao não saber resolver uma questão, 
escolhe aleatoriamente uma das cinco opções de resposta. 
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Sabemos que em 10 das 70 questões citadas as respostas de X e Y estavam iguais, em¬ 
bora erradas. 

a) Calcule a probabilidade de coincidência entre as respostas dos dois candidatos a 
essas 10 questões, supondo que não tenha havido fraude (cola). 

b) Na sua opinião houve ou não cola entre os dois candidatos? Por quê? 


Solução: 

a) Digamos que a resposta correta a uma certa questão seja a letra “a”. A probabili¬ 
dade de que, por não saber resolvê-la, X e Y respondam ambos por acaso a letra 

“b” é de - x - = —. Isso vale também para coincidências entre X e Y nas letras 
5 5 25 

“c”, “d” e “e”. Assim, a probabilidade de coincidência no erro entre X e Y nessa 
4 

questão é de —. Então, devido à independência, a probabilidade de coincidência 


no erro entre eles em dez questões é 



V25J 


= 1,09951 x IO" 8 . 


b) Vimos que, se não tivesse havido cola, a probabilidade de respostas coincidentes 
no erro entre X e Y em dez questões seria muito baixa. Como isso de fato aconte¬ 
ceu, tudo indica que houve cola. 


3.2_R) Torneio de voleibol - Quem vai para a final? 

Em um torneio de voleibol envolvendo oito países (A, B, C, D, E, F, G, H), a tabela de 
jogos a serem realizados é a seguinte: 


I a Rodada: 

Jogo 1: A x B Jogo 2: C x D Jogo 3: E x F Jogo 4: G x H 
(Local: País A) (Local: País C) (Local: País E) (Local: País G) 

2 a Rodada: 

Jogo 5: Venc. Jogo 1 x Venc. Jogo 2 Jogo 6:Venc. Jogo 3 x Venc. Jogo 4 
(Local: País Neutro) (Local: País Neutro) 

3 a Rodada: 

Jogo 7 (Final): Venc. Jogo 5 x Venc. Jogo 6 

Admita que a chance de vitória de um país é de 60% se ele joga em casa, de 40% se ele 
joga na casa do adversário e de 50% se o jogo se realiza em campo neutro e que todos os 
jogos sejam eliminatórios ( play-offs ). 

Qual a probabilidade de que a partida final seja: 

a) entre os países A e F? 

b) entre os países C e G? 

c) entre os países B e H? 

d) entre um país que estréia em casa e outro que estréia fora de casa? 

e) entre dois países que estréiam em casa? 

I) entre dois países que estréiam lora de casa? 
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g) Verifique que, se forem consideradas todas as alternativas possíveis para a parti 
da final, a soma das probabilidades correspondentes a elas é igual a I, como nao 
poderia deixar de ser. 

Solução: 

a) Para que a final seja entre A eF, devemos ter: (A vence B) e (F vence E) e (A ven¬ 
ce Vencedor jogo 2) e (F vence Vencedor jogo 4). Como A joga inicialmente em 
casa, F joga inicialmente na casa do adversário, os jogos 5 e 6 se realizam em 
campo neutro, e os resultados dos diversos jogos são independentes entre si, a 
probabilidade desse evento é então 0,6 x 0,4 x 0,5 x 0,5 = 0,06. 

b) Para que a final seja entre C e G, devemos ter: (C vence D) e (G vence H) e (C 
vence Vencedor Jogo 1) e (G vence vencedor jogo 3). Como CeGjogam inicial- 
mente em casa, os jogos 5 e 6 se realizam em campo neutro e os resultados dos 
diversos jogos são independentes entre si, a probabilidade desse evento é então 
0,6 x 0,6 x 0,5 x 0,5 = 0,09. 

c) Para que a final seja entre B e H, devemos ter: (B vence A) e (H vence G) e (B ven¬ 
ce Vencedor jogo 2) e (H vence Vencedor jogo 3). Como Be H jogam inicialmen¬ 
te na casa do adversário, os jogos 5 e 6 se realizam em campo neutro e os resulta¬ 
dos dos diversos jogos são independentes entre si, a probabilidade desse evento 
é então 0,4 x 0,4 x 0,5 x 0,5 = 0,04. 

d) A chance de que a final seja disputada entre dois países específicos, sendo que 
um estréia em casa e o outro estréia fora de casa (como no item (a)), é sempre 
igual a 0,06. Há oito finais possíveis desse tipo: A x F, A x H, B x E, B x G, C x F, C 
x H, D x E, D x G. Então, temos 8 x 0,06 = 0,48. 

e) A chance de que a final seja disputada entre dois países específicos que estréiam 
em casa (como no item (b)) é sempre igual a 0,09. Há quatro finais possíveis des¬ 
se tipo: A x E, A x G, C x E, C x G. Então, temos 4 x 0,09 = 0,36. 

0 A chance de que a final seja disputada entre dois países que estréiam fora de casa 
(como no item (c)) é sempre igual a 0,04. Há quatro finais possíveis desse tipo: B 
x F, B x H, D x F, D x H. Então, temos 4 x 0,04 = 0,16. 

g) A soma total das probabilidades é então 0,48+0,36+0,16 = 1. 

3.3_R) Detecção de infecção pelo vírus HIV 

Considere o desempenho de um teste T destinado a diagnosticar a presença de in¬ 
fecção pelo vírus HIV. A população considerada aqui é formada somente por doado¬ 
res de sangue e, entre cies, apenas 1 em cada 1.000 está infectado pelo vírus. 
Suponha que foi sorteada ao acaso uma pessoa dessa população e que ela será sub¬ 
metida ao teste T. 

Diremos que o evento: 

D + ocorre, se a pessoa está infectada 

D~ ocorre, se a pessoa não está infectada 

T + ocorre, se o resultado do teste for positivo 

T" ocorre, se o resultado do teste for negativo 
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Admita também que: 

• A probabilidade condicional P(T + |D + ) de o resultado do teste ser positivo dado que 
a pessoa está infectada é 0,85. 

• A probabilidade condicional P(T~|D~) de o resultado do teste ser negativo dado 
que a pessoa não está infectada é 0,99. 

a) Calcule a probabilidade condicional P(D + |T + ) de que a pessoa esteja infectada 
pelo HIV, dado que o resultado do teste foi positivo. 

b) Calcule a probabilidade condicional P(D _ |P) de que a pessoa não esteja infecta¬ 
da, dado que o resultado do teste foi negativo. 

c) Como a regra do produto se aplica dentro do contexto deste exercício? 


Solução: 

a) Pelos Teoremas da Probabilidade Total e de Bayes, vemos que 


P(D + |T + ) 


_P(T + |D + ) • P(D*)_ 

P(T + |D + ) ■ P(D + ) +P(T + |D~) • P(D") 


_0,85x0,001_ 

0,85x 0,001 + (1-0,99) x (1 -0,001) 


= 0,0784 ou 7,84%. 


Observe que esse valor é muito baixo, o que poderia ser interpretado como um 
indicativo de que o teste não é um bom preditor da presença da doença. Mas, evi¬ 
dentemente, o principal motivo para que isso tenha acontecido é o fato de que a 
prevalência da doença (1 em cada 1.000) é baixíssima nessa população. Assim, 
mesmo que o resultado do teste seja positivo, ainda haverá uma chance de 92,2% 
de a pessoa não estar infectada, 

b) Analogamente, 


P(D" |T~) = 


_P(T~1D~)-P(D~)_ 

P(T“|D + )-P(D + ) +P(T"|D" )-P(D") 


_0,99 x (1-0,001)_ 

(1 - 0,85) x 0,001+0,99 x (1-0,001) 


= 0,99985 ou 99,985% 


Como esse valor é altíssimo (quase 100%), um resultado negativo do teste 
pode ser encarado praticamente como uma garantia de que a pessoa não está in¬ 
fectada. 

c) Pelo Teorema da Probabilidade Total, vemos que: 

P(T + ) = P(P|D + ) . P(D + ) + P(PID-) . P(D ) 

= 0,85 x 0,001 + (1 - 0,99) x (1 - 0,001) = 0,01084 

e 

Pd ) = PCI |1) ( ) . P(D-) + P(T |D ) . P(D ) 

- (I 0,85) x 0,001 + 0,99 x (I 0,001) = 0,98916 

I mão lemos P(D*e D) - P(P|D*) P(l>) - P(D ( |P) . P(P) 

Ou, numericamente, 0,00085 0,85 x0,001 0,0784x0,01084. 
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Por outro lado, P(D e T ) = P( I |D ) . P(D ) = P(D I í ) . I’M ) 

Ou, numericamente 0,98901 = 0,99 x (I - 0,001) = 0,99985 x 0,08916. 

A validade da regra do produto loi, portanto, veriliçada neste caso particular < m qu< 
não há independência entre D 4 e T\ e nem entre D e I . 

Observação: Os conceitos de sensibilidade, especificidade, valor preditivo positivo <■ 
valor preditivo negativo de um teste, próprios da Bioestatística, correspondem resper 1 1 
vamente às probabilidades condicionais P(T + |D + ), P(T~|D~), P(D + | I') e PÍD 11 ) consi 
deradas anteriormente. 

EXERCÍCIOS PROPOSTOS 

3.1_P) Probabilidades em um conjunto de números inteiros 

Considere o espaço amostrai Q formado pelos 100 primeiros números naturais e ad¬ 
mita que todos os seus elementos tenham a mesma probabilidade 1/100. Sejam agora os 
seguintes eventos: 

A = conjunto dos números divisíveis por 2 
B = conjunto dos números divisíveis por 3 
C = conjunto dos números divisíveis por 5 

a) Qual o significado dos eventos AeB, AeC, BeC, AeBeC? 

b) Calcule P(A), P(B), P(C), P(AeB), P(AeC), P(BeC) e P(AeBeC). 

3.2_P) Esqueceu do código para acessar sua conta? 

Para se ter acesso a uma conta bancária usando um caixa eletrônico é preciso, além 
da senha, digitar um código de três letras, na ordem certa. O acesso é bloqueado se, em 
três tentativas sucessivas de digitar o código, todas forem malsucedidas. Igor conhece a 
senha, e a digita corretamente. Também sabe que o código tem as letras B, C e S, mas 
não sabe a ordem correta na qual elas devem ser digitadas. Assim sendo, escolhe ao aca¬ 
so uma ordem e digita o código. Se errar, escolhe uma outra ordem para digitar, e assim 
por diante. Determine a probabilidade de Igor ter o seu acesso: 

a) bloqueado; 

b) autorizado na segunda tentativa; 

c) autorizado na última tentativa; 

d) autorizado. 

3.3_P) Consulta médica 

Um determinado paciente tem uma consulta marcada com seu médico. Sabe-se que 
a probabilidade de que ele compareça no dia e hora marcados é de 0,90. Por outro lado, 
a probabilidade de que o médico receba um chamado urgente que o obrigue a desmar¬ 
car essa consulta é de 0,05. Admitindo que: 

• há independência entre esses dois eventos, ou seja, a eventualidade de o paciente 
não comparecer e a eventualidade do médico receber um chamado urgente; 

• esses são os únicos dois motivos que poderão fazer com que essa consulta não 
ocorra no dia e hora marcados; 
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determine a probabilidade de que ela (a consulta) não ocorra no dia e na hora mar¬ 
cados. 


3.4_P) Eventos independentes 

As probabilidades de que dois eventos independentes ocorram são p e q, respectivamente. 

a) Qual a probabilidade de que algum desses eventos ocorra isoladamente (ou seja: 
um dos dois ocorre, mas não os dois ao mesmo tempo)? 

b) Qual a probabilidade de que nenhum desses eventos ocorra? 

3.5_P) Seleção de candidatos para entrevista 

Uma relação de candidatos a um emprego consiste em cinco homens e três mulhe¬ 
res. Entre essas oito pessoas, apenas duas serão escolhidas ao acaso para serem entrevis¬ 
tadas. Qual a probabilidade de que os entrevistados sejam um homem e uma mulher? 

3.6_P) Mistura de frações de óleo diesel 

Em 11 frações de óleo diesel, cinco delas são do tipo LCO (light cycle oil ). Considere 
o seguinte experimento: sorteiam-se ao acaso e sem reposição três dessas frações para 
extrair uma amostra de cada uma delas e compor uma mistura de óleo diesel. 

a) Qual a probabilidade de que nessa mistura pelo menos um dos componentes 
seja LCO? 

b) Admita agora que o experimento anterior é realizado 20 vezes. Em média, em 
quantos desses experimentos se pode esperar que pelo menos um dos compo¬ 
nentes da mistura seja LCO? 


3.7_P) Tomada de decisão quanto a um investimento a ser feito 

Um investidor examina a possibilidade de comprar determinada ação de uma com¬ 
panhia. Ele considera três possíveis cenários: 

A performance esperada dessa ação com relação ao mercado poderá ser boa (B), re¬ 
gular (R) ou fraca (F), com probabilidades que dependem do cenário, como a seguir: 


0,6 -> performance boa (B) 





0,4 

Cenário Otimista (O) 



0,3 -> performance regular (R) 






0,1 -> performance fraca (F) 



0,3 -> performance boa (B) 




0,2 

Cenário Neutro (N) 



0,4 -> performance regular (R) 






0,3 -» performance fraca (F) 


0,2 > performance boa (B) 


0,3 > performance regular (R) 


(),‘> ► performance Iraca (F) 



0,4 


Cenário Pessimista (P) 
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a) Calcule as probabilidades de que a performance da ação seja boa, regular <■ frar a. 

b) Com base nos resultados do item anterior, o investidor deve ou não im orporar 
essa ação à sua carteira de aplicações? 

3.8_P) Informatização entre os psicólogos 

Entre os psicólogos que atuam profissionalmenle em uma grande cidade, 60% dedi 
cam-se à área de clínica, 20% estão na área empresarial e 20% atuam em outras áreas. 
Por outro lado, entre os psicólogos que atuam como clínicos, apenas 10% deles usam o 
computador normalmente no seu trabalho. Já entre os que estão no setor empresarial, 
os informatizados correspondem a 70%. E entre os que atuam em outras áreas, esse per¬ 
centual é da ordem de 40%. 

a) Calcule o percentual de psicólogos que não usam regularmente o computador, 
considerando a cidade como um todo. 

b) Entre os psicólogos não informatizados dessa cidade, que percentual atua na 
área de clínica? 

3.9_P) Teste de gravidez 

Para um determinado teste de gravidez, sabe-se que a sensibilidade (probabilidade 
condicional de o teste dar positivo, se a mulher está grávida) é de 98%, e a especificida¬ 
de (probabilidade condicional de o teste dar negativo, se a mulher não está grávida) é de 
95%. Antes de fazer o teste, uma determinada mulher estima em 20% a probabilidade 
de estar grávida. Com base nesses dados, calcule: 

a) a probabilidade condicional de que ela de fato esteja grávida se o resultado do 
teste for positivo. 

b) a probabilidade condicional de que ela de fato nâo esteja grávida se o resultado 
do teste for negativo. 

3.10_P) Perdido em uma encruzilhada 

Inácio, ao volante de seu conversível, encontra-se numa encruzilhada num setor ru¬ 
ral. Ele sabe que uma das estradas leva à cidade mais próxima, para onde ele deseja ir, e 
que a outra leva até uma fazenda vizinha, porém não sabe qual é a correta a seguir. Na 
encruzilhada ele encontra quatro camponeses A, B, C, e D que conhecem bem a estrada, 
e decide dirigir-se ao acaso a um deles para perguntar pela estrada que deve seguir. O 
que ele não sabe é que, enquanto A fala sempre a verdade, B fala a verdade só 75% das 
vezes, C 40% das vezes e D sempre mente. 

a) Determine a probabilidade de Inácio ser enviado pelo caminho certo. 

b) Se ele descobrir que foi enviado pelo caminho errado, qual a probabilidade de 
que o camponês B tenha sido o que lhe deu a informação? 

c) Mesma pergunta do item anterior para o camponês C. 

d) Mesma pergunta do item anterior para o camponês D. 


CAPÍTULO 4 


VARIÁVEIS ALEATÓRIAS 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Variável aleatória (v.a.) 

• Modelo probabilístico 

• Variável aleatória discreta e variável aleatória contínua 

• Função de probabilidade de uma v.a. discreta 

• Função de densidade de uma v.a. contínua 

• Função de distribuição acumulada de uma variável aleatória 

• Média populacional ou esperança de uma variável aleatória 

• Variância, desvio-padrão e coeficiente de variação de uma v.a. 

• Esperança de função de uma variável aleatória discreta 

• Distribuições discretas: Bernoulli, Binomial, Poisson 

• Distribuições contínuas: Uniforme, Exponencial e Normal 

• A curva Normal - padronização - Normal padrão 

• Tabela da Normal - quantil de uma distribuição 


Sexta-feira à tarde. Está chegando a hora de ir para a balada. 0 celular de Cesar não pára de 
tocar. 0 fim de semana promete: sexta à noite, a turma toda vai para o Baixo Gávea; sábado, 
praia o dia inteiro; sábado à noite, festa na casa da Claudinha; domingo, Fia x Flu no Maracanã. 

Mas, de repente, Cesar se lembra de que tem uma prova de Matemática na segunda-feira e 
está totalmente ‘‘por fora” da matéria. E o pior é que, se ele não conseguir uma boa nota, estará 
reprovado. 

E agora, o que fazer? 

Bem, essa prova terá apenas três questões de múltipla escolha, cada uma delas com cinco 
opções de resposta. E basta ele acertar duas dessas questões para ser aprovado. 

Imediatamente, Cesar tem uma idéia tentadora, que lhe permitirá passar mais um fim de se¬ 
mana longe dos livros: “E se eu simplesmente chutar as respostas das questões? Quem sabe es¬ 
tou no meu dia de sorte e acabo rne dando bem?" 
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4.1 INTRODUÇÃO 

EXEMPLO 4.1: Escolhendo as respostas ao acaso em prova de 

múltipla escolha 

Calculemos agora a probabilidade de Cesar ser bem-sucedido em sua prova de Vhnc 
mática, com a estratégia que escolheu. 

Para cada questão, representemos por A o fato de a resposta estar correta e por F o 
fato de ela estar errada. Cada resultado do espaço amostrai Q será uma sequência de A s 
e E’s. Há oito de tais seqüências, assim sendo Q = (AAA, AAE, AEA, EAA, AEE, EAE, 
EEA, EEE}. As probabilidades correspondentes são obtidas lembrando que para cada 
questão a probabilidade de acerto é 0,2 e a de erro é 0,8. Além disso, cada resposta da 
prova é escolhida de forma independente pelo estudante. 

Seja X a quantidade de respostas certas entre as três. Então X pode assumir os valores 
0, 1, 2 ou 3. 

Note que AAA corresponde a X = 3, e assim a probabilidade de X=3, denotada por 
P(X=3), será igual a P(AAA) = 0,2 3 = 0,008. 

Por outro lado, P(X=2) = P(AAE ou AEA ou EAA) = 3 x 0,2 2 x 0,8 = 0,096. 
Seguindo o mesmo raciocínio encontramos P(X=1) = P(AEE ou EAE ou EEA) = 

3 x 0,2 x 0,8 2 = 0,384, e P(X=0) = P(EEE)=0,8 3 = 0,512. Podemos resumir os resul¬ 
tados desses cálculos na seguinte tabela: 


n 

EEE 

AEE, EAE, EEA 

AAE, AEA, EAA 

AAA 

k = número de respostas certas 

0 

1 

2 

3 

P(X=k) 

0,512 

0,384 

0,096 

0,008 


Cesar será aprovado se X for maior ou igual a 2, ou seja, se X=2 ou X=3. A probabili¬ 
dade de que isso ocorra é dada por: 

P(X > 2) = P(X=2 ou X=3) = P(X=2) + P(X=3) = 0,096 + 0,008 = 0,104, 

isto é, aproximadamente 10%. É claro que não recomendamos a ninguém seguir a es¬ 
tratégia desse estudante. 

A variável X aqui considerada é um exemplo do que chamamos de variável aleatória. 
Note que as probabilidades dos diferentes valores de X foram calculadas a partir da as¬ 
sociação de cada valor de X com um subconjunto do espaço amostrai Q. 


No Capítulo 1, vimos o que é uma variável. No Capítulo 3, vimos o que é um espaço 
amostrai e como calcular a probabilidade de um evento. Neste capítulo, vamos reunir 
todos esses conceitos através da definição de variável aleatória. 


Uma variável aleatória (v.a.) é uma função que associa cada elemento de um es¬ 
paço amostrai a um número real. 
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Na prática, usualmente, não existe a preocupação de se explicitar qual é o espaço 
amostrai em que está definida a variável aleatória. O que importa é definir o conjunto de 
valores reais que a variável pode assumir e explicitar como se calcula a probabilidade de 
ela assumir tais valores. 

O conceito de variável aleatória é particularmente tátil em situações em que se dispõe 
de um nível de conhecimento parcial ou incompleto do comportamento da grandeza 
que está sendo estudada. Essa incerteza pode ser então introduzida sob a forma de um 
modelo probabilístico. 

EXEMPLO 4.2: Variáveis aleatórias do nosso cotidiano 

1. Marta costuma receber entre 20 e 30 mensagens de e-mail por dia. Depois de ter 
passado uma semana ausente e sem acesso ao seu correio eletrônico, qual é a 
chance de ela encontrar no máximo 100 mensagens na fila de entrada da sua cai¬ 
xa de e-mails? 

Aqui a variável aleatória é X = número de mensagens na caixa de entrada ao 
retornar da viagem, e tudo indica que é baixa a probabilidade P(X < 100). Por 
quê? 

2. Jorge mora a 17 hm do seu local de trabalho. Em sua cidade, os carros costumam 
trafegar a uma velocidade média que varia entre 40 km/h (quando há muito en¬ 
garrafamento) e 100 km/h (quando o trânsito está bastante livre). Qual é a chan¬ 
ce de que ele gaste no máximo 30 minutos no seu próximo deslocamento de casa ao 
trabalho? 

Aqui a variável aleatória é X = tempo em minutos gasto no deslocamento ca¬ 
sa-trabalho, e tudo indica que é alta a probabilidade P(X < 30). Por quê? 


4.2 TIPOS DE VARIÁVEIS ALEATÓRIAS 

As variáveis aleatórias são classificadas conforme a natureza do conjunto de valores re¬ 
ais que elas podem assumir. Os dois tipos mais importantes de variáveis aleatórias são: 

• variáveis aleatórias discretas 

• variáveis aleatórias contínuas 


Variável aleatória discreta 

()s valores (usualmente inteiros) que ela pode assumir pertencem a um conjun¬ 
to enumerável I de números reais. Se um número real está em E, a probabilida¬ 
de de que a variável assuma esse valor e cstritamente positiva. ( aso contrário, 
ela é nula. 
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(Lembrete: Um conjunto éenumerável quando existe urna correspondem ia I I cn 

tre os seus elementos e os números naturais.) 

Usualmente, os valores de uma variável aleatória discreta resultam de um pro< rsso 
de contagem. 

São exemplos de variáveis aleatórias discretas: 

• número de novas mensagens que estão à sua espera na fila de entrada a cada vez 
que você abre a sua caixa de e-mails; 

• número de visitas “bem-sucedidas” (ou seja, que resultaram na concretização de 
uma venda) em cada 20 visitas feitas por um vendedor. 


Variável aleatória contínua 

Para que a probabilidade de ela pertencer a um conjunto de números reais seja es¬ 
tritamente positiva, esse conjunto deve conter dentro de si um intervalo. 

Usualmente, esses valores são oriundos de uma medição. 

São exemplos de variáveis aleatórias contínuas: 

• tempo gasto no deslocamento de uma pessoa desde a sua residência até o local de 
trabalho; 

• perda de peso experimentada por uma pessoa submetida a uma dieta alimentar. 

Em cada um dos exemplos apresentados neste capítulo não é possível prever com 
exatidão que valor será assumido pela variável. Por outro lado, em todos os casos ilus¬ 
trados, é de se esperar que seja possível fazer afirmações probabilísticas sobre o com¬ 
portamento dessa variável. 

A descrição dos valores que a variável aleatória pode assumir juntamente com a pro¬ 
babilidade de ela assumir cada valor (ou intervalo de valores) é o que chamamos de dis¬ 
tribuição de probabilidade. 

Algumas variáveis aleatórias seguem padrões de comportamento em relação à sua 
distribuição de probabilidade. Tais padrões são denominados modelos probabilísticos 
e serão vistos nas subseções 4.3.4 e 4.4.4. O modelo dito Normal ou Gaussiano será 
apresentado na Seção 4.5. 


4.3 O CASO DISCRETO 

4.3.1 Função de Probabilidade e Função de Distribuição Acumulada 

A cada variável aleatória discreta estão associadas duas funções: a função de probabili¬ 
dade e a função de distribuição acumulada. 


A função de probabilidade p correspondente à variável aleatória discreta X asso¬ 
cia a cada número real x a probabilidade de que a variável X assuma aquele valor 
x. (Ou seja, x -> p(x) = P[X = xj.) 

A função de distribuição acumulada F correspondente à variável aleatória dis¬ 
creta X é definida por F(x) = P[X<x], para todo x real. 
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Observação: Na notação anterior, X (maiusculo) representa o nome da variável aleató¬ 
ria, enquanto x (minúsculo) representa um certo valor que essa variável pode assumir. 

Propriedades da Função de Probabilidade p 

a) Uma função de probabilidade só assume valores não-negativos. 

b) A soma de todos os valores de uma função de probabilidade é igual a 1. 

Propriedades da Função de Distribuição Acumulada F 

a) F é uma função não decrescente; isto é, se x for menor que y, então F(x) será me¬ 
nor ou igual a F(y). 

b) F(x) tende a zero quando x tende a -oo. 

c) F(x) tende a 1 quando x tende a +oo. 

d) O gráfico de F tem o aspecto de uma “função escada”, que sobe um degrau de al¬ 
tura p(x) no ponto x, sempre que p(x) > 0. 

A Figura 4.1 ilustra essas propriedades com um exemplo concreto. 

Para qualquer conjunto A de números reais, a probabilidade de que X pertença a A é 
a soma das probabilidades de X = x, para todo x em A. 

EXEMPLO 4.3: Número de filhos em uma família 

Em um determinado condomínio residencial: 

30% das famílias não têm filhos 40% das famílias têm um filho 

20% das famílias têm dois filhos 10% das famílias têm três filhos 

Seja X o número de filhos de uma família sorteada ao acaso desse condomínio resi¬ 
dencial. Então X é uma variável aleatória discreta com distribuição de probabilidade 
dada pela tabela a seguir: 


X 

0 

1 

2 

3 

p( X) =P(X=x) 

0,3 

0,4 

0,2 

0,1 

F(x)=P(X < x) 

0,3 

0,7 

0,9 

1,0 


Função de probabilidade Função de distribuição acumulada 
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x = Número de filhos x = Número de filhos 

FIGURA 4.1 Número de filhos por família em um condomínio residencial. 

I ui partic ulai poi exemplo, a probabilidade de que a família sorteada lenha no ma 
xjniü dois li lhos e 


I (2) - P(X ‘ 2) - 14X 4)) f P(X*I) + P(X 2) 0,3 + 0,4 + 0,2-04) 
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EXEMPLO 4.4: Total de pontos no lançamento de dois dados 

Consideremos novamente o experimento que consiste no lançamento de dois dad' >s. 

A variável aleatória X a ser considerada aqui é a soma dos pontos nos dois dados 
O espaço amostrai Q é composto de 36 elementos que são os pares ( resultado do pri 

meiro lançamento, resultado do segundo lançamento). 

É claro que, considerando Dl e D2 lançamentos independentes, todos esses pares 

têm a mesma probabilidade 1/36 de ocorrer. 


Soma dos pontos nos dois dados: Dl e D2 


Dl 

D2 

/ 

2 

3 

4 

5 

6 

1 

2 

3 

4 

5 

6 

7 

2 

3 

4 

5 

6 

7 

8 

3 

4 

5 

6 

7 

8 

9 

4 

5 

6 

7 

8 

9 

10 

5 

6 

7 

8 

9 

10 

1 1 

6 

7 

8 

9 

10 

1 1 

12 


A variável aleatória X é tal que: 
X(U) = 2, 

X(l,2) = X(2,l) = 3 
X(l,3) = X(2,2) = X(3,l) = 4 


X(5,6) =X(6,5) = 11 
X(6,6) = 12 

Neste exemplo os valores possíveis de X são 2,3,4,5,6,7,8,9,10,11,12 

Então não é difícil concluirmos que a função de probabilidade de X será representa¬ 


da pela tabela: 


X 

2 

3 

4 

5 

6 

7 

8 

9 

10 

1 1 

12 

P(X = x) 

1/36 

2/36 

3/36 

4/36 

5/36 

6/36 

5/36 

4/36 

3/36 

2/36 

1/36 


e terá seu gráfico como a seguir: 


0.20 

0.15 

0.10 

0.05 

0.00 


FIGURA 4.2 Função de probabilidade do número total de 
pontos no lançamento de dois dados. 



2 4 6 8 10 12 

x = Soma dos pontos nos dois dados 


Exercitando: Determine a função de distribuição acumulada de X e desenhe seu gráfico. 
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4.3.2 Medidas de Centralidade e de Dispersão 

Vários dos conceitos já introduzidos no Capítulo 1, sobre Análise Exploratória, rea¬ 
parecerão dentro do Cálculo de Probabilidades, agora com um novo enfoque. Tra¬ 
tam-se de conceitos tais como média, desvio-padrão etc. 

A média de uma variável aleatória discreta X é uma medida de centralidade. Ela é 
também denominada esperança, e por isso sua notação é E(X). 


Média ou Esperança de uma variável aleatória discreta: 

Se X é uma variável aleatória discreta que assume os valores x,, x 2 , x 3 ,... , x N com 
probabilidades p(x,), p(x 2 ), p(x 3 ),..., p(x N ) respectivamente , então sua média ou 
esperança é: 

E(X) = x, . P(X=x,) + x 2 . P(X=x 2 ) + x 3 . P(X=x 3 ) + ... + x N . P(X=x N ) = 

= x 3 . p(xj) + x 2 . p(x 2 ) + x 3 . p(x 3 ) + ... + x N . p(x N ) 



Observação: 

1. O conjunto dos valores possíveis de uma variável aleatória discreta pode ser até 
mesmo infinito, embora enumerável (veja, por exemplo, o modelo de Poisson 
adiante neste capítulo). Entretanto, como na maioria dos exemplos de variáveis 
aleatórias discretas a serem vistos neste livro esse conjunto de valores é finito, 
em nome da simplicidade, a suposição de finitude foi adotada na definição do 
conceito de esperança e em outros que aparecerão posteriormente. 

2. A esperança de uma variável aleatória é calculada como a média ponderada dos 
valores que essa variável assume, sendo o peso de cada valor igual à probabilida¬ 
de de que ela assuma esse valor. 


Interpretação física da média ou esperança: 

Se pensarmos na função f como uma distribuição discreta de massa, em que a massa 
localizada no ponto de abscissa x t é p(x,), então podemos perceber que E(X) corres¬ 
ponde exatamente à abscissa do centro de gravidade dessa distribuição. 


Observação: Outras medidas de centralidade, tais como a mediana e a moda, podem 
também ser introduzidas dentro desse contexto. Entretanto, optamos por não apresen¬ 
tar aqui esses conceitos. 

EXEMPLO 4.5: Número de filhos de uma família 

Na siluação do exemplo anterior, em que X é o número de filhos de uma família sor¬ 
teada ao acaso daquele condomínio, o valor médio de X é 

E(X) = 0. P IX = 0] + 1 . P [X= 11 + 2.P [X = 2] + 3.P [X =3 1 
= 0 x 0,3 + 1 x 0,4 + 2 x 0,2 + 3 x 0,1 = 1,1 filho por família. 
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EXEMPLO 4.6: Total de pontos nos dois dados 

No caso visto anteriormente, do lançamento de dois dados, temos 

E(X) = (2 + 12)x — + (3 + 11) x —+ (4 + 10) x — +(5 + 9)x 
36 36 36 

x —+ (6+8)x —+ 7x —= 7 
36 36 36 

Isso significa que se esses dois dados forem lançados (digamos) 1.000 vezes, a média 
aritmética do número total de pontos nesses 1.000 lançamentos deve estar muito próxi¬ 
ma de 7. 


EXEMPLO 4.7: Escolhendo o melhor investimento 

O Departamento de Investimentos de uma instituição pretende decidir em qual de 
cinco companhias ela deve investir de modo a maximizar o seu retorno presumido. A 
tabela a seguir fornece a taxa de retorno projetada para o investimento em cada compa¬ 
nhia, supondo três cenários econômicos possíveis. 


Cenário 

Companhia 

A 

B 

C 

D 

E 

1 (Otimista) 

12% 

17% 

15% 

9% 

20% 

II (Neutro) 

1 \% 

15% 

9% 

8% 

10% 

III (Pessimista) 

10% 

8% 

5% 

7% 

5% 


Que estratégia utilizar para essa escolha? 

Estratégia 1 

Escolher a companhia E porque é a que oferece a maior taxa de retomo possível (20%) con¬ 
siderando todas as companhias e todos os cenários. É uma escolha de alto risco. Por quê? 

Estratégia 2 

Escolher a companhia A porque é a que maximiza o retorno esperado (10%) sob as con¬ 
dições mais desfavoráveis (Cenário III). É o critério mais conservador. Por quê? 


Estratégia 3 - Maximização do retorno esperado 

Idéia: Quantificar as chances de que prevaleça cada um dos possíveis cenários econô¬ 
micos. Suponha que elas são: 

P(Cenário I) = 0,33 P(Cenário II) = 0,52 P(Cenário III) = 0,15 

Então, podem ser calculadas as esperanças das taxas de retorno correspondentes às 
cinco companhias. Por exemplo, para a Companhia B, temos: 

17 x 0,33 + 15 x 0,52 + 8 x 0,15 = 14,61% 
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Procedendo analogamente para as demais companhias, obtemos: 

A B C D E 

11,18% 14,61% 10,38% 8,18% 12,55% 

Neste caso, a escolha recairia na Companhia B. Essa escolha, baseada na maximiza¬ 
ção do retorno esperado, leva em consideração todos os cenários e foi feita através do 
cálculo do retorno esperado para cada companhia. 


Vejamos agora as medidas de dispersão. 


Variância de uma variável aleatória discreta: 

Se X é uma variável aleatória discreta que assume os valores x,, x 2 , x 3 ,... , x N com 
probabilidades p(x,), p(x 2 ), p(x 3 ),..., p(x N ) respectivamente, então sua variância 
é calculada por: 

Var(X)=(x 1 -E(X)) 2 .P(X=x 1 )+(x 2 -E(X)) 2 .P(X=x 2 )+...+(x N -E(X)) 2 . P(X=x N ) = 

=(xj - E(X)) 2 .p(x,) + (x 2 - E(X)) 2 . p(x 2 ) +... + (x N - E(X)) 2 . p(x N ) 


Podemos observar que a variância é a média ponderada dos quadrados das diferen¬ 
ças entre cada valor da variável e a sua esperança, sendo que o correspondente peso é 
novamente igual à probabilidade de que a variável assuma esse valor. 


Interpretação física da variância: 

Fazendo novamente um paralelo com a Mecânica, vemos que Var(X) correspon¬ 
de exatamente ao momento de inércia da distribuição discreta de massa represen¬ 
tada pela função de probabilidade p em relação a um eixo vertical que passa pelo 
ponto de abscissa E(X). 


Observação: A variância de X também pode ser calculada pela expressão 

Var(X) = {x 2 -p(x,) + x 2 -p(x 2 ) + x 2 • p(x 3 )+...+x 2 N • p(x N )} - (E(X)} 2 

O desvio-padrão de uma variável aleatória discreta é igual à raiz quadrada positi¬ 
va da sua variância: DP(X) = Jvãr (X). 

O coeficiente de variação de uma variável aleatória discreta é igual ao quociente 

DP(X) 

entre o desvio-padrão e a média: CV(X) = -p-— (desde que E(X) seja não-nula). 
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Analogamente, também existem outros conceitos de medida dc disp< t ao 

exemplo, a distância interquartil, mas eles não serão vistos ncsie livro 

EXEMPLO 4.8: Novamente o número de filhos de uma família 

Voltando mais uma vez ao exemplo do número de filhos visto anteriorrm nu l( nif ’ ■ 

Var(X) = O 2 . P [ X = 0 1 + l 2 . P [ X = 1 ] + 2 2 . P [ X = 2 ] + 3 2 . P I X = 3| - (E(X)y 
= O 2 . 0,3 + l 2 . 0,4 + 2 2 . 0,2 + 3 2 . 0,1 - 1,1 2 
= 0,89 

DP(X) = y[Õ$9 = 0,943 filhos. 

0 Q4T 

CV(X) = ^-^ = 0,857. 

u ■ 


EXEMPLO 4.9: Voltando ao lançamento de dois dados 

Neste caso, para o número total de pontos, temos: 


Var(X) = 


( 2 2 + 12 2 ) x — + (3 2 +ll 2 )x —+ (4 2 +10 2 
36 36 


x —+ (5 2 +9 2 )x 
36 


x—+ (6 2 +8 2 ) x — +7 2 x — 
36 36 36 


-7 2 


= 5,833 


DP(X) = 75,833 = 2,415. 
2 415 

CV(X) = ^2-^= 0,345. 

7 


Como o coeficiente de variação é uma grandeza adimensional, é sempre possível 
comparar duas variáveis através desse indicador. Assim, embora este exemplo e o ante¬ 
rior tratem de situações inteiramente diferentes, podemos dizer que, em termos relati¬ 
vos, a variabilidade é maior no caso do exemplo sobre o número de filhos do que no 
caso do exemplo sobre o número total de pontos nos dois dados. 

4.3.3 Valor Esperado de uma função de Variável Aleatória Discreta 

Suponha que: 

• X é uma variável aleatória discreta que assume os valores x„ x 2 , x 3 ,..., x N com pro¬ 
babilidades correspondentes p^),..., p(x N ) 

e 

• h é uma função real de variável real. (ver Apêndice I) 

Então Y = h(X) é também uma variável aleatória, e seu valor esperado pode ser calcu¬ 
lado por E(Y) = E(h(X)) = h(x,)p(x,) + h(x 2 )p(x 2 ) + h(x 3 )p(x 3 ) + - + h(x N )p(x N ) 

EXEMPLO 4.10: Novamente o número de filhos 

Voltando ao exemplo anterior sobre o número X de filhos em uma família selecionada 
ao acaso do condomínio, seja Y a variável aleatória definida pela expressão Y = (X-1,1)-. 
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Então,E(Y) = (0-l,l) 2 x0,3 + (l-l,l) 2 x0,4 + (2-l,l) 2 x0,2 + (3-l,l) 2 x0,l=0,89. 
Ora, este é exatamente o valor de Var(X). Conforme veremos mais adiante, há uma 
explicação para isso: a propriedade geral segundo a qual Var(X) = E[ (X -E(X)) 2 ]. 


4.3.4 Alguns dos modelos discretos mais importantes 

Apresentamos a seguir alguns dos modelos probabilísticos discretos que costumam 
ser mais utilizados nas aplicações práticas da Estatística. 


O modelo de Bernoulli 

Este é o modelo adequado para experimentos aleatórios em que o espaço amostrai 
consta de somente dois resultados denominados “sucesso” e “fracasso”, sendo p a pro¬ 
babilidade de sucesso e (1 - p) a probabilidade de fracasso. Um experimento dessa na¬ 
tureza é chamado de “experimento de Bernoulli” ou, mais popularmente, “ensaio de 
Bernoulli”. 

Dada a constante p, (onde 0 < p < 1), uma variável aleatória X que somente assume os 
valores 0 (fracasso) ou 1 (sucesso), de tal forma que 

P(X = 1) = p e P(X = 0) = 1 - p 

tem distribuição de Bernoulli com parâmetro p. 

Neste caso é fácil verificar que E(X) = p e Var(X) = p(l - p). 


Basta ver que E(X) = 0.(1 - p)+l.p = p e 
Var(X) = [0 2 .(1 - p)+l 2 .p] - p 2 = p - p 2 = p(l - p). 


Então, DP(X) = Vpd-P) e CV(X) 


i 


1-P 

P 


A escolha ao acaso de uma resposta em uma questão de múltipla escolha, como no 
Exemplo 4.1 do estudante, apresentado na abertura deste capítulo, é um ensaio de Ber¬ 
noulli, em que podemos identificar um acerto como sucesso e um erro como fracasso. 
Nesse caso, p = 0,20 e 1 - p = 0,80. 


O modelo Binomial 

Para introduzir as idéias, lembremo-nos, mais uma vez, do Exemplo 4.1 no início deste 
capítulo. Quando Cesar escolhe ao acaso uma resposta para cada uma das três questões, 
está realizando três ensaios independentes de Bernoulli, com p = 0,2 (probabilidade de 
acerto) e 1-p = 0,8 (probabilidade de erro) em cada ensaio. A variável aleatória de inte¬ 
resse, X, é o número de acertos nas três questões, vale dizer, o número de sucessos nos 
três ensaios. As probabilidades calculadas no exemplo citado podem ser obtidas da ma¬ 
neira que se segue: 

P(X=0) = 0,8 } ; P(X=1) = 3(0,8) 2 (0,2); P(X=2) = 3(0,8)(0,2) 2 e P(X=3) = (0,2 ) 3 

Substituindo 0,2 por p e 0,8 por q = 1 - p , encontramos: 

P(X=0) = q' J ; P(X=J) = 3q 2 p; P(X=2) = 3qp 2 e P(X=3) = p 5 

Podemos observar que essas probabilidades correspondem aos termos do desenvol¬ 
vimento do binômio de Newlon (p + q)‘. 
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Agora, sejam n um inteiro positivo e p um número real enire 0 e I 
Esse resultado pode ser generalizado para o caso de n realizações indept nd< m< , <\< 
um ensaio de Bernoulli, com probabilidades p de sucesso e (1 - p) de Iracasso c m < 'da 
ensaio. Se X é a variável aleatória que representa o número de sucessos nos n ensaios as 
probabilidades de X assumir os valores 0, 1, 2,n serão dadas pelos termos do d< st n 
volvimento do binômio (p+q) n . 

A partir da expressão do termo geral desse desenvolvimento podemos esc rever. 


í A 

p(k) = P(X=k) = p k (l-p)"- k , para todo k = 0,1,2,...,n, 

v k y 


onde o símbolo 


v k y 


vem da Análise Combinatória, lê-se “combinações de n elementos 

n • (n - l)-...-(n - k + 1) 


tomados k a k” e pode ser calculado por 

l^k ) k-(k-l)-(k-2)-...-2-1 

Neste caso diz-se que a variável X segue uma distribuição de probabilidade binomial 

com parâmetros n e p. 

Prova-se também que E(X) = n p e Var(X) = n p (1 - p). 


Então, DP(X) = Jnp(l-p) e CV(X) = P—^ 

V n P 


Os valores das probabilidades relativas a uma binomial podem ser obtidos direta¬ 
mente a partir de um software adequado. 

Observação: Pode ser provado também que ^P[X =k] = p k (l-p) n ~ k =1 

k=o\kj 


k=0 


EXEMPLO 4.1 I: Aquarianos 

Em quatro pessoas escolhidas ao acaso na multidão: 

a) Qual a probabilidade de que nenhum deles seja do signo de Aquário? 

b) Qual a probabilidade de que entre eles haja exatamente dois aquarianos? 

c) Qual a probabilidade de que haja no mínimo dois aquarianos entre os 4? 

d) Qual o número esperado de aquarianos entre os 4? 

Observação: Admita que os 12 signos são equiprováveis. 

Solução: 

Neste caso, considere como sucesso “ser aquariano”. 

A seleção de cada pessoa pode ser considerada como um ensaio de Bernoulli com 
probabilidade 1/12 de sucesso e 11/12 de fracasso. 

Seja X o número de aquarianos entre as quatro pessoas selecionadas. 

Então X obedece a uma distribuição binomial com n = 4 e p = 1/12. 

a) Usando a expressão matemática que define a função de probabilidade da bino¬ 
mial, obtemos: 


P(X = 0) = 


(l/l2)° (1 l/l2) 4 =0,70607 
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Nesses cálculos foram utilizados os fatos de que =1 e — = 1 (ver 

Apêndice I). V^J vl2y 

Vejamos agora como se poderia chegar a esse valor somente pelo raciocínio. 

Para que X seja igual a 0, todas as quatro pessoas sorteadas teriam de ser não 
aquarianas. Em cada um dos quatro sorteios, a probabilidade de que a pessoa 
sorteada seja não aquariana é 11/12. Então, devido à independência entre os sor¬ 
teios, pela regra do produto, a probabilidade de X = 0 é ' 


/ 11 V 


12 


b) Pela fórmula, temos P(X = 2) = 


Í 4 1 

, 2 , 


—Y x f n 

12J x I12; 


= 0,03501. 


Agora, acompanhe o raciocínio. Para que X seja igual a 2, duas das quatro pes¬ 
soas sorteadas teriam de ser aquarianas, e as outras duas teriam de ser não aqua¬ 
rianas. Em cada um dos quatro sorteios, a probabilidade de que a pessoa sortea¬ 
da seja aquariana é 1/12, e a probabilidade de que ela seja não aquariana é 11/12. 
Então, devido à independência, pela regra do produto, a probabilidade de que as 
duas primeiras sorteadas sejam aquarianas e as duas últimas não o sejam é 

. Falta agora levarmos em conta as posições das duas aquarianas 

dentro dos quatro sorteios realizados. Como fazê-lo? Se S representa “sim, é 
aquariano” e N representa “não, não é aquariano”, qualquer uma das seis combi¬ 
nações a seguir nos levam a X = 2: 

SSNN SNSN SNNS NSSN NSNS NNSS 

Por esse mesmo argumento, podemos concluir que cada uma dessas seis 


í 1 1 

2 fu) 

V 

,12, 

U 2 J 


combinações tem probabilidade igual a 


,12; 


(11Y 

— de acontecer. Então, 
12 


como as seis combinações são mutuamente exclusivas duas a duas, pela regra da 

12 J 


soma, a probabilidade de X = 2 é 6 
c) P(X > 2) = P(X=2) + P(X=3) + P(X=4)= 


f —Y 

,12, 


" 4 Y1V 

,2 Jll 2 J 


x 


í— Y 
02, 


+ 


f 4 Y 1 V 

, 3 JUã; 


í—Y 
, 12 , 


f 4 l 

í 1 1 

4 

X 

'in 

, 4 , 

, 12 , 


,12, 


0,03501 + 0,00212 + 4,82 x 10“ 5 = 0,03718. 
d) E(X) = 4 x (1/12) = 1/3 = 0,333. 

Já que I :(X) é o centro de gravidade de uma distribuição de massa e os pontos 
em que as cinco “massas” estão localizadas têm abscissas 0, I, 2, 3, 4, por que 
essa média ponderada resultou assim tão próxima de zero? A resposta aqui é que 
a probabilidade de X sei igual a 0 e muito maior do que todas as demais, como 
mostra a figura a seguir. 
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FIGURA 4.3 Função de probabilidade do número de aquarianos na amostra. 


EXEMPLO 4. 12: A função de probabilidade da binomial para vários valores de n e p 
A figura a seguir exibe o gráfico das funções de probabilidade relativas à lei de proba¬ 
bilidade Binomial, para diferentes valores dos parâmetros n e p. Na primeira linha n = 3, 
na segunda n = 6 e na última n = 20. Quanto às colunas, temos p = 0,1 na primeira, p = 
0,5 na segunda e p = 0,7 na terceira. 
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FIGURA 4.4 Função de probabilidade da Binomial (n,p). 
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O modelo de Poisson 

Imaginemos uma situação em que eventos, todos da mesma natureza, se sucedem ao 
longo do tempo. Por exemplo: 

• chamados telefônicos recebidos por uma central; 

• chegadas de navios a um porto; 

• chegadas de clientes a uma agência bancária. 

Suponhamos que X é a freqüência média de ocorrência desses eventos por unidade 
de tempo. Uma vez fixado um certo intervalo de tempo de amplitude t, admitiremos 
que o número X de tais eventos que ocorrem ao longo desse intervalo é uma variável 
aleatória e que 

P[x=k] = e , k = 0,1,2,... 

k! 


Neste caso, dizemos que X obedece a uma distribuição de Poisson com parâmetro p = À.t. 
Prova-se que E(X) = À,t e Var(X) = Át. 

Conseqüentemente, DP(X) = VÃÃ e CV(X)= —j= . 

Vxt 


Observação: 

1. Notemos que neste caso a v.a. X, embora discreta, pode assumir um número in¬ 
finito de valores. 

2. Na realidade, quando um fenômeno se comporta conforme o que foi descrito, 
diz-se que se trata de um processo de Poisson com parâmetro X. 

3. A constante p = À.t é o número esperado de ocorrências do fenômeno considera¬ 
do ao longo de t unidades de tempo. 

4. Pode ser provado que —— = 1, ou seja, ^P[X =k] = 1 

k=0 k! k=0 


EXEMPLO 4.13: A função de probabilidade de uma Poisson 

A figura a seguir exibe o gráfico das funções de probabilidade para uma distribuição 
de Poisson, sendo considerados três casos: 

Át = 1, Xt = 3 e Át = 10 




XX = 1 


XX = 3 


>4 = 10 


FIGURA 4.5 Função de probabilidade da Poisson com >4 = I ou 3 ou 10. 
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EXEMPLO 4.14: Consultas ao site de uma empresa 

Admita que o número de consultas à homepage de uma determinada empresa dutan 
te um período de tempo obedece a uma distribuição de Poisson e que em media há duas 
consultas por dia. Qual a probabilidade de que em um(a) determinado(a). 

a) dia sejam feitas exatamente três consultas? 

b) semana (7 dias) sejam feitas no máximo dez consultas? 

c) mês (30 dias) sejam feitas pelo menos 50 consultas? 


Solução: 

e (At) k 

Em qualquer dos casos, usaremos o modelo P[X = k] =-— , onde A = 2 e X é a 

variável aleatória que conta o número de consultas ao longo de t dias. 

e -2 (2) 3 


a) Aqui t = 1 e At = 2. Então, P[X = 3) = 


3! 


= 0,1804. 


uc, e _H Q4) k 

b) Aqui t = 7 e At = 14. Então, P[X < 10] = £- = °> 1757 - 

k=o k! 

c) Aqui t = 30 e At = 60. 

Então, P|X > 50] = 1 - P[X < 49] = 1 -£ e -- ° ( — = 1 - 0,0844 = 0,9156. 

ii=o k! 


Observação: Note que, em um problema desse tipo, já que os cálculos envolvidos são 
bastante trabalhosos, é conveniente o uso do computador. 


Algumas outras famílias de distribuições discretas, tais como a hipergeométrica, a 
uniforme discreta, a binomial negativa, a geométrica, Pascal etc. não serão vistas aqui. 


4.4 O CASO CONTÍNUO 

Um estudo mais aprofundado das variáveis aleatórias contínuas exigiria o uso de um 
ferramental matemático que está além do escopo deste livro, a saber, alguns conceitos e 
resultados do Cálculo Diferencial e Integral. Nosso propósito é apresentar as idéias bá¬ 
sicas de maneira informal e recorrendo sempre que possível a uma visualização geomé¬ 
trica do problema, bem como ao estabelecimento de paralelos com conceitos da 
Mecânica tais como centro de gravidade e momento de inércia. Veremos os conceitos 
de função de densidade, função de distribuição acumulada, medidas de centralidade e 
dispersão, e estudaremos em mais detalhe os modelos Uniforme, Exponencial e Nor¬ 
mal. Outros modelos de distribuições contínuas (Gama, Beta, Lognormal etc.) não se¬ 
rão aqui apresentados. Mais adiante, nos Capítulos 7 e 8, serão apresentados também os 
modelos Qui-quadrado, t de Student e F de Fisher-Snedecor. 
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4.4.1 Função de Densidade e Função de Distribuição Acumulada 


Para cada variável aleatória contínua X existe uma função f, chamada função de 
densidade de X, tal que para qualquer intervalo [a,b], a probabilidade de que um 
valor sorteado de X esteja entre a e b, representada por P [a < X < bl, é igual à área 
sob a curva que representa a função f, entre as verticais passando por a e por b, e 
acima do eixo horizontal. Ou seja, ela corresponde à área em destaque na figura a 
seguir. 



f(x) 



FIGURA 4.6 Probabilidade vista como área no caso contínuo. 


Como no caso discreto, a cada variável aleatória contínua X corresponde também 
uma função de distribuição acumulada (abreviadamente, FDA) F, que aqui no¬ 
vamente é definida pela relação F(x) = P[X<x], para todo x real. 


Propriedades da Função de Densidade f 

a) f só assume valores não-negativos. 

b) A área total sob a curva é igual a 1. 

Propriedades da Função de Distribuição Acumulada F 

a) À medida que x cresce no conjunto dos reais, F(x) também varia continuamente 
entre 0 e 1. 

b) F é uma função não decrescente; 

c) F(x) tende a 0 quando x tende a -oo; 

d) F(x) tende a 1 quando x tende a +oo; 

e) Se a < b, P[a < X < b] = F(b) - F(a) 

Fxiste uma relação estreita entre as funções de densidade f e de distribuição acumu¬ 
lada I ambas relativas a uma mesma variável aleatória contínua X. Geometricamente, 
para lodo numero real x, a área sob a curva de I entre -oo e x é igual ao valor da função 
F no ponto x. 

Observação Na linguagem do (Calculo, diríamos que I e a derivada de F e que F é uma 
integral de F 
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EXEMPLO 4.15: Erros de arredondamento 

Quando números reais são arredondados para os inteiros que lhes são mais próxi¬ 
mos, os erros de arredondamento assumem valores entre -0,5 e +0,5. Além disso, dado 
um subintervalo qualquer 1 = (a,b) contido no intervalo [-0,5; +0,51, a probabi 1 idade 
de que o erro de arredondamento X pertença a I deve ser proporcional a sua amplitude 
b - a. Podemos então considerar que esse erro X se comporta como uma variável aleató¬ 
ria contínua cuja função de densidade é 


f(x) = 


1 , 


10 , 


se -0,5< x< 0,5 
caso contrário 


e cuja função de distribuição acumulada é 


F(x) = 


0, se x < -0,5 

0,5+ x, se-0,5<x<0,5 
1, sex>0,5 


Como veremos adiante, este é um caso particular da chamada distribuição uniforme 
contínua. 

Então, por exemplo, a probabilidade de que o erro de arredondamento X seja menor 
que 0,2 (em módulo) pode ser calculada como a área do retângulo em destaque na figu¬ 
ra a seguir, ou seja, 

P[|X| < 0,21 = Base x Altura = 0,4 x 1 = 0,4 


O 



X 


FIGURA 4.7 Função densidade do erro de arredondamento. 


Em geral, a função de densidade não é tão simples quanto nesse exemplo. Por isso, 
para determinar probabilidades (ou seja, áreas sob a curva da 0, a rigor seria necessário 
recorrer ao cálculo de integrais. 

Como procederemos então? Felizmente, a maioria das distribuições que aparecem 
nos problemas práticos encontra-se tabulada e também disponível em diversos soft¬ 
wares. 

Vejamos inicialmente um exemplo em que não há como evitar o cálculo de integrais. 

















ELSEVIER 


VARIÁVEIS ALEATÓRIAS I 13 


EXEMPLO 4.16: Tempo de atendimento no caixa de um supermercado 

Admita que, em um supermercado, o tempo T em minutos necessário para que um 
cliente seja atendido pelo caixa na saída se comporta como uma variável aleatória cuja 
função de densidade é dada pela expressão 


0, se t< 0 

f(t) =1 tl 

— t exp — , se t >0 

[ 4 l 2 ) 

O gráfico dessa função está na Figura 4.8. 



FIGURA 4.8 Função densidade para o tempo de atendimento 
(em minutos) no caixa de um supermercado. 


A figura sugere, por exemplo, que, na maioria dos casos, o cliente é atendido em me¬ 
nos de cinco minutos e que só muito raramente o tempo de atendimento é superior a 
dez minutos. 

O cálculo de probabilidades relativo a esse tempo de atendimento implicaria na de¬ 
terminação de áreas sob a curva da figura anterior, por integração. ■ 


Nota: Ao contrário do que ocorre com as variáveis aleatórias discretas, no caso de uma 
variável aleatória contínua X, quando se deseja calcular a probabilidade P[a < X < b) de 
que X esteja dentro do intervalo [a, b], não importa se os extremos do intervalo estão ou 
não incluídos. Em outras palavras, se X é uma v. a. contínua então 

P[a<X<b]=P[a<X<b]=P[a<X<b]=P[a<Xcb] 

simplesmente porque P ( X = x 1 = 0, para todo x real. Por que esta última afirmação é 
verdadeira? 

4.4.2 Medidas de Centralidade e de Dispersão 

No caso de variáveis aleatórias contínuas, a maneira matematicamente correta de intro¬ 
duzirmos os conceitos de média, variância etc., seria apelarmos para o Cálculo Integral. 
Como essa não é a proposta deste livro, um outro possível caminho seria pensarmos na 
densidade de probabilidade como uma distribuição contínua de massa e introduzirmos 
os ( oik eitos de media e variância através de paralelos com conceitos da Física, tais como 
centro de gravidade e momento de inen ia, icspcclivamcntc. Na próxima seção explora¬ 
remos lambem os aspectos visuais da I unção densidade, com o intuito de explicar os con¬ 
ceitos de media e variância de uma vaiiável alealoi ia continua, sob outro ângulo. 
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A medida de centralidade a ser apresentada aqui é novamente a média ou e-.p« i n 
ça. Seja X uma variável aleatória contínua com função de densidade I I nlao por 
analogia com o caso discreto, define-se a media ou esperança de X, representada 
por E(X), como sendo a abscissa do centro de gravidade da distribuição de proba 
bilidade representada pela função f, vista aqui como se fosse uma distribuição 
contínua de massa. 


Pensemos na distribuição de massa representada pela função de densidade f como se 
ela fosse uma chapa de alumínio (praticamente bidimensional). A forma dessa chapa 
seria exatamente a da região do plano que corresponde à área total sob a curva, como, 
por exemplo, na Figura 4.6. Qual seria a abscissa do ponto pelo qual deveríamos pen¬ 
durar essa chapa de alumínio através de um cordão, de modo a que ela ficasse bem equi¬ 
librada, ou seja, não pendesse nem para a esquerda nem para a direita. Essa é exatamente 
a posição do centro de gravidade. 

Observação: Usando as ferramentas do Cálculo, a média de uma v.a. contínua X é obti¬ 
da através de um processo de integração. 


EXEMPLO 4.17: Erros de arredondamento (cont.) 

Voltando à variável X = erro de arredondamento vista no Exemplo 4.15, pela própria 
simetria da sua função densidade com respeito à reta vertical x = 0, não é difícil perceber 
que E(X) = 0, ou seja, em média, o erro de arredondamento é nulo. ■ 

EXEMPLO 4.18: Tempo de atendimento no caixa de um supermercado (cont.) 

No caso da variável T, tempo de atendimento no caixa do supermercado, visto ante¬ 
riormente, é possível mostrar (com base em métodos de integração) que E(T) = 4 minu¬ 
tos. Ou seja, em média, cada cliente do supermercado é atendido no caixa durante 4 
minutos. B 

E quanto às medidas de dispersão? 

Vimos que, no caso contínuo, o conceito de esperança pode ser introduzido através 
da idéia de centro dt gravidade de uma distribuição contínua de massa. Se X é uma va¬ 
riável aleatória contínua com densidade f, o conceito de variância de X também pode 
ser introduzido através de um paralelo com a Física. Novamente por analogia com o 
caso discreto, poderíamos pensar na variância como sendo o momento de inércia da 
distribuição contínua de massa representada pela função de densidade f com respeito a 
um eixo vertical que passa pelo seu centro de gravidade. 

Considere novamente aquela chapa de alumínio pendurada por um cordão, exata¬ 
mente na posição do seu centro de gravidade. Digamos que a nossa intenção fosse dar 
um “peteleco” nessa chapa para fazê-la girar em torno do eixo vertical representado 
pelo cordão. Quanto maior for a força com que esse “peteleco” precisa ser dado para 
promover a rotação da chapa em torno do eixo vertical, maior será o seu momento de 
inércia, ou seja, sua variância. 
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Observação: 

1. Usando as ferramentas do Cálculo, a variância de X é também obtida através de 
um processo de integração. 

2. Se você não entendeu essa tentativa de se conceituar a variância, paciência. Não 
desanime, você ainda tem uma chance. Esqueça o paralelo com a Física e vá dire¬ 
to para a Subseção 4.4.3, em que se pretende explicar os conceitos de média e va¬ 
riância de uma v.a. contínua através de uma argumentação geométrica. 


O desvio-padrão de X é, por definição, a raiz quadrada não negativa da variância de X. 
Ou seja, DP (X) = ^/VaKX). 

O coeficiente de variação de X é, como antes, o quociente entre o seu des- 

DPf X) 

vio-padrão e a sua média, ou seja, CV(X) =-, se E(X) é não nula. 


EXEMPLO 4.19: Mais uma vez, o erro de arredondamento 

Conforme será visto adiante na apresentação teórica da distribuição uniforme contí¬ 
nua, pode ser provado que, para a variável X = erro de arredondamento do Exemplo 
4.15, temos: Var(X) = 1/12, DP(X) = ^1/12 = 0,289. Aqui o coeficiente de variação 

CV(X) não existe porque, como foi visto anteriormente, E(X) = 0. ■ 

EXEMPLO 4.20: Mais uma vez, o tempo de atendimento no supermercado 

Voltando ao exemplo anterior sobre o tempo de atendimento no caixa do supermer¬ 
cado, pode-se mostrar que: 

Var(T) = 8 min 2 DP(T) = V8 = 2,83 min CV(T) = Vã/4 = 0,707 

Isso quer dizer que, para a variável tempo de atendimento no caixa do supermerca¬ 
do, o desvio-padrão é cerca de 70% da média. ■ 

4.4.3 Visualização geométrica dos conceitos de média e variância 

Uma vez que o comportamento de uma variável aleatória contínua X é basicamente ca¬ 
racterizado por sua função densidade f, como o aspecto visual do gráfico da f pode nos 
ajudar a interpretar os conceitos de média e variância de X? 

Geometricamente, diremos que: 

• Quanto mais à direita estiver o centro de gravidade da f no gráfico, maior será a 
média da variável considerada. 

• Quanto mais espalhado (disperso, aberto) for o gráfico da f com relação à sua mé¬ 
dia, maior será a variância da variável considerada. 

EXEMPLO 4.21: O visual da densidade, a média e a variância 

As J iguras 4.9 e 4.10 a seguir nos mostram como ficaria o gráfico de: 

• ires funções densidade com a mesma variância e médias diferentes 

• trés funções densidade com a mesma média e variâncias diferentes 
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FIGURA 4.9 Três funções densidade com médias diferentes e com a variância constante 

É fácil ver que essas três curvas são exatamente iguais a menos de uma translação. 
Por isso, elas têm todas a mesma variância, embora suas médias sejam diferentes. 



FIGURA 4.10 Três funções densidade com variâncias diferentes e com a média constante. 

Essas três curvas têm todas elas o mesmo centro de gravidade (no caso, o ponto de 
abscissa igual a 4). Porém, em termos de suas dispersões em torno da média, elas não 
são iguais. Por isso, elas têm todas a mesma média, embora suas variâncias sejam dife¬ 
rentes. 


4.4.4 Alguns dos Modelos Contínuos mais Importantes 


O modelo Uniforme Contínuo 

Dizemos que uma variável aleatória tem distribuição uniforme no intervalo [a,b], se 
a probabilidade de que ela esteja no interior de qualquer subintervalo de [a,b] é pro¬ 
porcional à amplitude desse subintervalo. 

Matematicamente, dados os números reais a e b ( a < b ), diz-se que a variável aleató¬ 
ria X tem distribuição uniforme no intervalo [a,b], se suas funções de densidade (0 e de 
distribuição acumulada (F) são dadas por 


f(x) = 


1 


, se a < x < b 

b -a 

0,caso contrário 


0, se x < a 


F(x) = < 


x -a 
b -a 
1 , 


se a < x < b 

se x > b 


Neste caso temos: E(X) = (a + b)/2 e Var(X) = (b - a)712. 


Então DP(X) = e CV(X) = ^ (b a) 

y/Í2 


24 (a + b) 
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f(x) F(x) 



FIGURA 4.1 I A densidade e a FDA da Uniforme [a,b]. 


EXEMPLO 4.22: O ponteiro de segundos de um relógio 

Seja X o ângulo, medido em graus, formado pelo ponteiro dos segundos de um reló¬ 
gio e a vertical que passa pelo centro do relógio e pelo número 12. 

Como a velocidade angular do ponteiro é constante, é razoável supor que todos os 
valores de X entre 0 o e 360° são igualmente prováveis. Sendo assim, a distribuição de 
probabilidade de X é uma uniforme no intervalo [0,360]. 


EXEMPLO 4.23: Novamente o erro de arredondamento 

É fácil ver que a variável X = erro de arredondamento considerada nos Exemplos 
4.15, 4.17 e 4.19 segue uma lei de probabilidade uniforme no intervalo [-0,5; 0,5]. 


Observação: Escolher ao acaso um ponto P dentro de um intervalo [a,b] é o mesmo que 
dizer que a coordenada X do ponto em questão é uniformemente distribuída sobre 
[a,b]. Por esse motivo, a distribuição uniforme contínua tem um papel de destaque na 
conceituação do que seja um gerador de números aleatórios, ferramenta fundamental 
da metodologia de Simulação por Monte Cario. 


O modelo exponencial 

Se X é uma constante positiva, dizemos que a variável aleatória X obedece a um mo¬ 
delo probabilístico exponencial com parâmetro X, quando suas funções densidade e 
distribuição acumulada são dadas pelas expressões: 


f(x) 


0, sex<0 

A.exp(-À,x), se x > 0 


e 


F(x) = 


1 “' 

[1 - exp(-Áx), 


se x < 0 
se x > 0 


Neste caso temos: E(X) = - , Var(X) = DP(X) = - e CV (X) = 1. 

XXX 

A f igura 4.J2 mostra, no mesmo gráfico, como ficam as funções f (densidade) e F 
(distribuição acumulada) no caso em que X = Vi. 

Observe que nessa figura, por exemplo, a ordenada da função de distribuição acu¬ 
mulada I no ponto x = 3, ou seja, F(3) = I -exp(-l ,5) = 0,777 é numericamente igual à 
area em destaque sob o gráfico da I unção de densidade I entre x = 0ex = 3. 
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FIGURA 4.12 A relação entre a função densidade e a função de distribuição 
acumulada relativas a uma lei de probabilidade exponencial. 


A distribuição exponencial é em geral utilizada para modelar o comportamento de 
uma variável do tipo “intervalo de tempo necessário para que algo ocorra”. Por exemplo: 

• Intervalo de tempo entre duas chegadas consecutivas de clientes a uma agência 
bancária, a um supermercado... 

• Intervalo de tempo necessário para se atender um cliente em um banco, em uma 
loja comercial... 

Dentro desse contexto, o parâmetro X da distribuição exponencial tem uma inter¬ 
pretação interessante: trata-se da freqüência média de ocorrências do fenômeno consi¬ 
derado por unidade de tempo. Por outro lado, x= 1/Á é o valor médio desse intervalo de 
tempo, à luz do modelo exponencial, já que E(X) = 1/X =x. 


A relação entre os modelos Exponencial e de Poisson 

Existe uma relação forte entre os modelos Exponencial e de Poisson: 

Um fenômeno se comporta segundo um processo de Poisson com parâmetro Á, 
ou seja, o número X de ocorrências ao longo de um intervalo de amplitude t é uma 


variável aleatória discreta, tal que P[X = k] = 


(Át) k 


k! 


, k = 0,1,2,..., 


se e somente se 

O intervalo de tempo T entre quaisquer duas ocorrências consecutivas desse 
fenômeno é uma variável aleatória contínua que segue uma lei exponencial com 
parâmetro Á, isto é, P[T < t] = 1 - z~ Xt , para todo t > 0. 

Muitas são as situações práticas que podem ser descritas adequadamente através 
desses dois modelos (Poisson e exponencial): 

• Chegadas de navios a um porto. 

• Chegadas de clientes a uma loja comercial. 

• Chegadas de mensagens à caixa de e-mails de uma pessoa. 

• etc. 













VARIÁVEIS ALEATÓRIAS I I 9 

HLSEMER 

Exemplo 4.24: Tempo de vida de uma lâmpada 

O tempo de vida T de um certo tipo de lâmpada segue uma distribuição exponencial 
com média de 1000 horas. Se foi encomendado um lote com 10.000 lâmpadas desse tipo: 

a) Determinar a percentagem dessas lâmpadas que deverão se queimar antes de 
1.000 horas. 

b) Após quantas horas de vida deverão ter se queimado 90% das lâmpadas do lote? 
Solução: 

a ) Sabemos que E(T) = 1/À. = 1.000. Logo, À. = 0,001. Isso quer dizer que a frequên¬ 
cia média de “mortes” dessas lâmpadas é de 0,001 lâmpada por hora. 

Queremos determinar P [T < 1.000], Basta então calcular a área sob a densi¬ 
dade da exponencial com À, = 0,001 desde 0 até 1000, cujo valor é 

F(1000) = 1 - e- 0 001 * 1000 = 1 - e- 1 = 0,632. 

Isso quer dizer que, passadas 1000 horas, cerca de 63,2% das lâmpadas deve¬ 
rão estar queimadas. 

b) Queremos obter um valor x 0 tal que P [ T < t 0 ] = 0,9. 

Desta vez, sabemos o valor da área e queremos determinar o limite superior 
do intervalo. 

F(T 0 ) = 1 - exp (-0,00lt 0 ) = 0,9 => exp (-0,00 ltQ = 0,1 => 

-O.OOlto = ln(0,l) = -2,303 => to = 2.303 horas 

Isso quer dizer que, passadas 2.303 horas, cerca de 90% das lâmpadas deverão estar 
queimadas. 

Observação: A solução de ambos os itens pode ser também obtida diretamente a partir 
de um software que contenha a exponencial acumulada (direta e inversa). ■ 

4.5 A DISTRIBUIÇÃO NORMAL 

Dada a sua relevância no cálculo de probabilidades, dedicaremos uma seção deste capí¬ 
tulo exclusivamente ao modelo Normal ou gaussiano. 

4.5.1 Generalidades 

Por várias razões, a distribuição Normal é o modelo mais usado em todo o Cálculo de 
Probabilidades. A curva Normal ou Gaussiana descreve de forma muito adequada o 
comportamento de uma variável que se distribui de forma simétrica em relação a um 
valor central. Os dois parâmetros que a caracterizam são a média p, que especifica o seu 
valor central, e a variância a 2 , que define a sua variabilidade. 

Dadas as constantes p e a 1 (onde a > 0), diz-se que a variável aleatória X tem distribui¬ 
ção Normal com parâmetros p e a 2 se a sua densidade é dada pela expressão matemática 

... I | I (x -p)’ 1 

I(x) — exp? - ; >, para lodo x real. 

Jlna I 2 cr J 
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A notação X ~ N(p; a 2 ) significa “a variável X tem distribuição Normal com parâme¬ 
tros p e a 2 ”. 

As duas figuras a seguir nos mostram o aspecto visual, respectivamente, da função 
densidade e da função de distribuição acumulada de uma Normal. 


f(x) 



FIGURA 4.13 A densidade da distribuição Normal. 


Curiosidade: 

Lembre-se de que, em alguns exemplos anteriores de distribuições discretas, os 
gráficos das funções de probabilidade dos modelos binomial (Figura 4.4) e de 
Poisson (Figura 4.5) já sugeriam um comportamento “Gaussiano”. Qual será a 
explicação para isso? 



4 6 8 10 12 14 16 

média = 10 e DP = 3 

FIGURA 4.14 Gráfico da função de distribuição acumulada da Normal (p; <j 2 ). 

4.5.2 Padronização da Normal 

Se X ~ N(p,a ), então I [p — zcr < X < p + zcr| tem sempre o mesmo valor, quaisquer que 
sejam os parâmetros p e a 2 . Em outras palavras, essa probabilidade depende somente 
do valor de z e independe dos particulares valores de p e de a. Isso quer dizer que a va¬ 
riável X tem distribuição Normal com parâmetros p e o 2 se e só se a variável Z = X 

a 

tem distribuição Normal com média 0 e variância 1. Esta última é também chamada dis¬ 
tribuição Normal padrão ou distribuição Normal reduzida. 
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Esta propriedade é da maior importância. Veremos adiante que ela nos é muito útil 
quando desejamos calcular probabilidades relativas a uma variável com distribuição 
Normal. Assim, qualquer cálculo de probabilidades relativo a uma normal (p;a 2 ) pode¬ 
rá se reduzir a um cálculo que envolve somente a Normal padrão, sendo que esta apre¬ 
senta a grande vantagem de se encontrar tabulada. 

Daqui em diante serão usadas as letras 9 e O para representar, respectivamente, a fun¬ 
ção densidade e a função de distribuição acumulada correspondentes à normal padrão. 

Ouseja,seZ~N(0;l),cp(z) = —Lrexpi--z 2 1 e ®(z) = P(Z<z), para todo z real. 

V2^ l 2 J 


FIGURA 4.15 Gráficos das funções cp(.) e <t>(.) 

4.5.3 Outras Propriedades da Distribuição Normal 

A distribuição Normal (p, a 2 ) goza de várias outras propriedades, entre as quais es¬ 
tão as seguintes: 

a) A curva Normal é simétrica com respeito à reta vertical que passa por x = p. 

b) Se X ~ N(p; o 2 ), então E(X) = p, Var(X) = a 2 e DP(X) = a. 

c) Se X~ N(p; a 2 ), então P[p-2a< X< p + 2a] =0,95 (Ou seja, se a variável X segue 
uma curva Normal, em aproximadamente 95% dos casos o valor de X estará dis¬ 
tante da média de menos de dois desvios-padrão.) 

Para a distribuição Normal padrão, podemos dizer que: 

a) A curva da densidade 9 é simétrica com respeito à vertical z = 0. Daí decorre que 
0 >(—z) + O(z) = 1 , para todo z real; 

b) Se Z ~ N(0; 1), então E(Z) = 0 e var(Z) = 1. 

c) Se Z ~ N(0; 1), então P[-2 < Z < 2] = 0(2) - 0(-2) = 0,95. 

EXEMPLO 4.25: Distribuição de peso de pessoas adultas 

Suponha que os pesos das pessoas adultas que pertencem a uma determinada popu¬ 
lação seguem uma curva normal com média p = 70 kg e desvio-padrão a = 10 kg. Por- 
tanio, p 2a = 70 - 2 x 10 = 50 e p + 2a = 70 + 2 x 10 = 90 
I mão podemos afirmai que: 

• cerca de 95% dessas pessoas pesam enlre 50 kg e 90 kg; 

• cert a de 2 5% dessas pessoas pesam menos de 50 kg; 

• cerca de 2 5% dessas pessoas pesam mais de 90 kg. 
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A Figura 4.16 ilustra os resultados obtidos. 




FIGURA 4.16 Distribuição do peso (em kg) - Densidade e FDA. 

■ 

EXEMPLO 4.26: Como interpretar a média e a variância de uma curva Normal? 

Cada um dos gráficos da figura a seguir nos permite comparar duas curvas Normais 
em termos de suas médias e suas variâncias. 





Observações importantes sobre a Normal: 

1 . É muito comum se representar o erro (ou o desvio) na medição de uma grandeza 
por uma variável aleatória cuja lei de probabilidade é uma Normal centrada em 
zero. 

2. O Teorema Central do Limite, a ser abordado no Capítulo 6, é uma razão a mais 
para justificar a importância da distribuição Normal no contexto do Cálculo de 
Probabilidades. 
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4.5.4 Uso da Tabela da Normal para o Cálculo de Probabilidades 

Suponha que X ~ N(p; a 2 ), ou seja, a variável X tem distribuição Normal com parâme¬ 
tros p e a 2 e que queremos calcular P(a < X < b), para um determinado intervalo (a,b). 
Segundo o conceito de função de densidade, essa probabilidade corresponderia à área 
sob a curva da Normal (p, a 2 ) entre x = a e x = b. 

Então, no Exemplo 4.25, a probabilidade de uma pessoa sorteada ao acaso da popu¬ 
lação pesar entre 65 e 80 quilos corresponderia à seguinte área sombreada. 

S 


Ò 

O 

o 

d 


FIGURA 4.18 Probabilidade como área sob a curva Normal 
p = 70, o = 1 0, a = 65, b = 80 

Felizmente, existe uma forma prática e simples de efetuar esse tipo de cálculo com o 
auxílio de uma tabela de probabilidades que se refere especificamente à função de dis¬ 
tribuição acumulada ®(.) da Normal padrão (Ver Tabela I, no Apêndice II). 

Admita que Z ~ N(0; 1). Antes de mais nada, vamos introduzir um pouco de notação: 

• Seja p = P (Z < z p ) = ®(z p ). 

• z p representa um valor qualquer da variável Z, também chamado quantil de Z, ex¬ 
presso com duas casas decimais. 


co 

d 


d 


o 

d 


FIGURA 4.19 Trabalhando com a tabela da normal padrão - funções (p(.) e <J>(.) 


FDA d>(.) 



Função densidade tp (.) 





EXEMPLO 4.27: Aprendendo a trabalhar com a Tabela I da Normal padrão 

A explicação será toda feita com base em exemplos numéricos. 

Observação: Noie que P(Z < z p ) = P(Z < z p ), para qualquer valor de z p , porque a variável 
Z é contínua. 

J Determinação de p = P(Z < z p ) a partir de z p . 

Exemplos: 

• Seja z |; = 0,83. O valor de pestá na linhaO.He na coluna 0.03 da Tabela 1. Logo, 
p = 0,7967. C’om lusão: P(Z < 0,83)=0,7967 
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• Seja z p = 1,57. O valor de p está na linha 1.5 e na coluna 0,07 (.la íabHal 
Logo, p = 0,9418. Conclusão: P(Z < 1,57)=0,9418 

2. Determinação de quaisquer probabilidades relativas a Normal padrao / 
Exemplos: 

• P(Z > 0,75) = 1 - P(Z < 0,75) = 1 - 0,7734 = 0,2266 

• P(0,26 < Z < 1,02) = P(Z < 1,02) - P(Z < 0,26) = 0,8461 - 0,6026 - 0,2435 

• P(Z < -0,66) = P(Z > 0,66) = 1 - P(Z < 0,66) = 1 - 0,7454 = 0,2546 

• P(Z > -1,23) = P(Z < 1,23) = 0,8907 

• P(-0,39 < Z < 0,72) = P(Z < 0,72) - P(Z < -0,39) = P(Z < 0,72) - 
(1-P(Z < 0,39)) = 0,7642 + 0,6517 - 1 = 0,4159 

• P(|Z| >0,58) = 2.P(Z>0,58) = 2. (1 -P(Z< 0,58)) = 2 x (1 -0,7190) = 0,5620 

3. Determinação de quantil z p da Normal padrão dada uma probabilidade (Isso 
corresponde a trabalhar com a inversa da FDA de Z, isto é, z p = dHfp).) 
Exemplos: 

• Determinar z p tal que P(Z<z p ) = 0,81. 

Pela tabela, vemos que z p = 0,88. 

• Determinar z p tal que P(Z > z p ) = 0,73. 

Como P(Z > z p ) > 0,5, então z p < 0. Logo, P(Z < -z p ) = 0,73. 

Daí, -z p = 0,61 e então, z p = - 0,61. 

• Determinar z p tal que P(|Z|<z p ) = 0,16. 

Como P(lZ|<z p ) = P(-Zp<Z<z p ) = P(Z<z p ) - P(Z<-z p ) = 

= P(Z<z p ) - (1 - P(Z<z p ) ) = 2.P(Z<z p ) - 1, 

P(Z<z p )=M^ =0 ,58. 

2 


Então z p = 0,20. 


r 

4. Determinação de quaisquer probabilidades relativas a Normal genérica 
Exemplos: 

• Se X ~ N( 8 ; 9), P(X > 9) = ? 


P(X > 9) = P 


X -8 9-8 
>- 


= P (Z > 0,33) = 1 - 0,6306 = 0,3694. 


V9 3 

Observe que, para garantir a equivalência entre as condições (X > 9) e 
fX -8 9-8^1 

^ ^ ’ as mesmas operações que foram aplicadas ao primeiro mem¬ 

bro da desigualdade tiveram de ser também aplicadas ao segundo membro. 
Se X ~ N( 15; 16), P(|X-15J< 3) = ? 

X -15 


P(|X-15|< 3) = P 


( 


VTó 


3 
< — 

4 


= P(|Z| < 0,75) = 2 . P(Z < 0,75) - 1= 


=2 x 0,7734 - 1 = 1,5468 - 1 = 0,5468. 


5. Determinação de quantil de Normal genérica dada uma probabilidade. 
Exemplo: 

• Se X ~ N(20;25) e P(X > b) = 0,60, então b = ? 

Como P(X > b) > 0,50, então b < 20. 
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0,60 = P(X > b) = P 
b -20 


■J25 


> 


A 

f b -20 ^ 

= P 

Z> 

) 

1 5 ) 


Daí, sendo a = ———, temos P(Z > a) = P(Z < - a) = 0,60. 

5 

Logo,-a = 0,25, o que implica-=-0,25, e então, b = 20-0,25 x 5= 18,75. 

6 . Determinar parâmetro de Normal genérica dada uma probabilidade. 
Exemplo: 

• Se X ~ N(p;25) e P(X < 32) = 0,35, então p = ? 


0,35 = P(X< 32) = P 


/ 


^ ^ \ Isso implica que ——— = -0,39. (Por quê?) 


Z< /— 
V V25 


Então, p = 32 + 5 x 0,39 = 33,95 


EXEMPLO 4.28: Comparando os retornos de uma ação e de um título 

Suponha que, uma vez fixado um horizonte de tempo, a taxa de retorno de uma ação 
pode ser modelada como uma variável aleatória com distribuição Normal de média 
20% e desvio-padrão 2%. Suponha também que a taxa de retorno de um título de renda 
fixa é de 17%. Então a ação é em média mais rentável do que o título, embora seja mais 
sujeita a risco. Qual a probabilidade de que o retorno da ação excederá o do título? 


Solução: Seja X a taxa de retorno da ação. Então X ~ N(20; 2 2 ). 


P(X > 17) = P 


r X-2 0 
ç 2 


> 


17 - 20 ^ 
2 , 


= P(Z > - 1,5) = 0,933 ou 93,3% 


No exemplo 4.25, qual a probabilidade de uma pessoa sorteada ao acaso da popula¬ 
ção pesar enre 65 e 80 quilos, que corresponde à área sombreada na Figura 4.18? 

EXEMPLO 4.29: Tempo (em minutos) necessário para executar uma tarefa 

Suponha que o tempo X em minutos que uma pessoa leva para executar determinada 
tarefa varia conforme uma distribuição Normal com parâmetros p (média) e a (des¬ 
vio-padrão). Suponha também que a probabilidade de que a tarefa seja executada em no 
máximo 70 minutos é 0,75, e a probabilidade de que a tarefa seja executada em no má¬ 
ximo 50 minutos é 0,25. 

a) Determine os valores de p e ct. 

b) De todas as pessoas que necessitam de pelo menos 75 minutos para executá-la, 
que percentagem precisará de mais de 85 minutos? 

Solução: Sabemos que X lem distribuição Normal com parâmetros p ea’. Isso implica 
que Z ^ lem disiribuiçáo Normal padrão, isto é, com esperança 0 e desvio-pa- 

CT 


dráo 1. 
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a) Então 0,75 = P[X < 70| = P 


2 < 


70-1.1 


a 


70 p 

, de onde se deduz que - 0,67, 

n 


consultando uma tabela da normal reduzida ou um software apropriado 


Analogamente, 0,25 = PlX < 501 = P 
55^ = -0,67. 


2 < 


50 - p 


a 


, de onde se obtém 


Ficamos então com um sistema de duas equações a duas incógnitas: p e n. Re¬ 
solvendo esse sistema, temos p = 60 e o = 14,9, ambos em minutos. 


b) Temos que calcular uma probabilidade condicional, a saber, 


X - 60 85-60 

> 


P|X> 85 |X>75]=^^l = -ii^_ 14*1 ^47^,297 


P[X > 75] 


X -60 75-60 

14,9 14,9 


P[Z> 1,01] 0,157 


Ou seja, 29,7% das pessoas que executam a tarefa em pelo menos 75 minutos levam 
no mínimo 85 minutos nessa atividade. 


RESUMO DO CAPÍTULO 4 

• Uma variável aleatória (v.a.) é uma função que associa cada elemento de um 
espaço amostrai a um número real. 

• As variáveis aleatórias podem ser do tipo: 

Discreto: se os seus valores pertencem a um conjunto enumerável de núme¬ 
ros reais (usualmente valores inteiros). 

Contínuo: se os seus valores pertencem a um intervalo de números reais. 

• O modelo probabilístico de uma variável aleatória X estabelece o padrão de 
comportamento de sua distribuição de probabilidade. 

• A funçào de probabilidade p de uma v. a. discreta X é definida por p(x) = P[X = 
x], para todo x real. 

• A função de distribuição acumulada F de uma v. a. discreta X é definida por 
F(x) = P[X<xl, para todo x real. 

• Dada uma v.a. discreta X, para qualquer conjunto A de números reais, a proba¬ 
bilidade de que X pertença a A é a soma das probabilidades P[X = x], para todo x 
em A. 

Se X é uma v.a discreta que assume os valores x,, x 2 , x 3 , ... , x N , então: 

• A média ou esperança de X é 

E(X) = x, . P(X = x,) + x 2 . P(X = x 2 ) + x 3 . P(X = x 3 ) + ... + x N . P(X = x N ) 

• A variância de X é calculada por 

Var(X)=(x,-E(X)) 2 .P(X = x,)+(x 2 -E(X)) 2 .P(X = x 2 )+...+(x N -E(X)) 2 . P(X = x N ) 
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• O desvio-padrão de X é igual à raiz quadrada não-negativa da sua variância, 

DP(X)= VVar(X). 

• O coeficiente de variação de X é igual ao quociente entre o desvio-padrão e a 

média, CV(X) = (desde que E(X) seja não-nula). 

E(X) 

• Se Y é uma função de X, isto é se Y = h(X), então Y é também uma v.a., e o valor 
esperado de Y é calculado por: 

E(Y) = E(h(X)) = h(X|)p(x,) + h(x 2 )p(x 2 ) + h(x 3 )p(x 3 ) + ... + h(x N )p(x N ) 

• O quadro a seguir apresenta os modelos probabilísticos discretos (ou distri¬ 
buições de probabilidade discretas) aqui estudados, com seus respectivos pa¬ 
râmetros, função de probabilidade, média e desvio-padrão. 


Modelo 

Parâmetro(s) 

Valores possíveis 
dos parâmetros 

Função de Probabilidade 

Média 

Variância 

Bemoulli 

P 

0 < p < 1 

P(X=l)=p. 

P(X=0)= l-p 

P 

P(l-P) 

Binomial 

n e p 

n inteiro positivo 
e 0 < p < 1 

p(x=k)=r]p k (i-p) n - k , 

\ K / 

para k = 0,1 ,2 .n, 

np 

np(l-p) 

Poisson 

5 

II 

n 

o 

A 

n 

P ( x= k ) = 
v ' k! 

para k=0, 1 , 2 ,... 

Xt 

Xt 


• Dada uma v.a. contínua X, sua função de densidade f é tal que, para qualquer 
intervalo [a,bl, P [a < X < b j corresponde à área em destaque na figura a seguir. 

f(x) 



• Para uma v.a. contínua X, sua função de distribuição acumulada F é definida 
por F(x) = P|X<x], para todo x real. 

• As funções de densidade f e de distribuição acumulada F relativas a uma variá¬ 
vel aleatória contínua gozam de determinadas propriedades, cujo detalhamen¬ 
to pode ser consultado na teoria deste capítulo. 

• O quadro a seguir apresenta os modelos probabilísticos contínuos (ou distri¬ 
buições de probabilidade contínuas) aqui estudados, com seus respectivos pa¬ 
râmetros, função de densidade, média e desvio-padrão. 
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Modelo 

Parâmetros 

Valores possíveis 
dos parâmetros 

Função de Densidade 

Média 

Variância 

Uniforme 

a e b 

a < b 

f(x) = • 

— ! —, se a á x < b 
b- a 

0, caso contrário 

a + b 

2 

(b-a/ 

12 

Exponencial 

X 

X>0 

í 0, se x < 0 

f(x) = 

[Áexp(-Áx), se x > 0 

1 

X 

1 

t 

Normal 

M e a 2 

p qualquer 

a > 0 

„ N 1 í 1 (x-p) 2 

(x) V2íc exp { 2 o 2 r 

para todo x real 

M 

o z 


• Notação: X ~ N(p; a 2 ) denota que a variável aleatória X tem distribuição Nor¬ 
mal com média p e variância a 2 . 

X — u 

• Se X ~ N(p; a 2 ) então a variável aleatória Z =-— tem distribuição Normal 

a 

com média 0 e variância 1, ou seja, Z ~ N(0; 1). Diz-se que Z tem distribuição 

Normal padronizada. 

• A FDA da distribuição Normal padronizada encontra-se tabulada (Apêndice II, 
Tabela I). 


EXERCÍCIOS RESOLVIDOS 

4.I_R) Condição para concretização de uma venda 

Um certo tipo de componente é vendido em lotes de 1.000 itens. O preço de venda 
do lote é usualmente de 60 u.m. Um determinado comprador propõe ao vendedor ex¬ 
trair de cada lote uma amostra com 20 itens; se não houver entre eles nenhum defeituo¬ 
so, ele paga 70 u.m. pelo lote; se houver exatamente 1 item defeituoso, ele paga 60 u.m 
pelo lote; se houver 2 ou mais itens defeituosos, ele paga 50 u.m pelo lote. Se o vendedor 
sabe que em geral cerca de 5% desses itens são defeituosos, ele deverá aceitar ou não 
essa proposta? 


Solução: 

Seja X o numero de itens defeituosos na amostra. Então X segue uma lei Binomial com 
n = 20 e p = 0,05. Por outro lado, o preço Y a ser pago segundo essa proposta é tal que 


'70, se X =0, 



se X = l, 
se X > 2, 


o que ocorre com probabilidade 0,95 20 = 0,358 

o que ocorre com probabilidade 20 x 0,05 x 0,95 19 = 0,378 
o que ocorre com probabilidade 1 - 0,358 - 0,378 = 0,264 


Então E(Y) = 70 x 0,358 + 60 x 0,378 + 50 x 0,264 = 60,94 u.m 
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Como o preço usual de venda é 60 u.m. por lote, isso mostra que em média a propos¬ 
ta é ligeiramente vantajosa para o vendedor, embora seja mais sujeita a riscos. Isto por¬ 
que, segundo a proposta do comprador, há uma variabilidade envolvida no preço de 
venda. 


4.2_R) Ler ou não ler os seus e-mails 

Suponha que o processo de chegada de mensagens na caixa de e-mail de uma pessoa 
segue uma lei de probabilidade de Poisson a uma taxa média de 30 mensagens por se¬ 
mana. Para não gastar um tempo excessivo na leitura de e-mails, ela estabeleceu para si 
mesma a regra de consultar a sua caixa apenas uma vez por dia e só ler o seu conteúdo se 
houver no máximo 3 mensagens à sua espera. Se essa regra for seguida durante 5 dias, 
calcule as probabilidades de que: 

a) em cada um dos 5 dias ela não lerá seus e-mails; 

b) em pelo menos 1 dos 5 dias ela não lerá seus e-mails. 


Solução: 

O número X de mensagens recebidas ao longo de um dia segue uma lei de Poisson 


exp 


com X = 30/7 mensagens por dia e t = 1 dia, ou seja, P(X = k) = 


f 30" 

"30 ^ 




k! 


para 


k = 0,1,2,... 

A probabilidade de que em um determinado dia cheguem no máximo 3 mensagens é 
P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 


exp 


( 30 Y 30 ^ 

o 

( 30^1 

(30) 

i 

( 30 A 

f 30 ^ 

“ — — 

exp 

— - 

— 

exp 

— - 

— 

V 7 A 7 ) 


1 7 J 

V 7 ) 


1 7 J 

V 7 ) 


0 ! 


1 ! 


2 ! 


exp 


i 

u 

o 

1 

1 o 

1 7 J 

V 7 ) 


3! 


= 0,380 


a) Devido à independência, a probabilidade de que em cada um dos 5 dias ela não 
lerá seus e-mails é (1 - 0,380) 5 = 0,092. 

b) Devido à independência, a probabilidade de que em pelo menos um dos 5 dias 
ela não lerá seus e-mails é 1 - 0,380 5 = 0,992. 


4.3 R) Planejamento do estoque de camisas de uma loja de roupas 

Um fabricante de camisas sociais masculinas sabe que a circunferência do pescoço 
dos seus clientes é uma variável aleatória que obedece a uma lei de probabilidade Nor¬ 
mal com média 15,25 polegadas e desvio-padrão 0,50 polegada. Seu objetivo é calcular, 
para cada possível tamanho de colarinho, que percentagem de camisas deve ser confec¬ 
cionada As circunferências de colarinho consideradas, em polegadas, são: 15,00 (PP); 
15,50 (P); 16,00 (M); 16,50 (G); 17,00 (GG). 
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a) 

b) 


Calcule esses percentuais, admitindo que deve haver uma folga cl«- p< 1,1 m * nos 
0,75 polegada do tamanho do colarinho com relação ao tamanho do " 

Os percentuais somam 100%? Sc sim, por que sim ■ Se não, p"' M 1 " 


Solução: 

a) O tamanho X da circunferência do pescoço segue uma lei Normal < orn m« dia 
15,25 e desvio padrão 0,50. Então, o tamanho Y do colarinho da camisa lem que 
ser X + 0,75. Ou seja, a lei de Y deve ser Normal com média 16 e desvio-padrão 0,5. 


Calculemos o percentual da procura por camisas de tamanho PP. 

L 15,00-16,00 

Percentual PP (15,00) = 100% . P[Y < 15,00] = 100% . P Z< ^ ^ 


= 100% . P[Z < - 2] =2,27%. 

Calculemos agora o percentual da procura por camisas tamanho P. 


Percentual P (15,50) = 100% . P[ 15,00 < Y < 15,50] 


=100%.P 


15,00 - 16,00 ^ 2 ^ 
0,50 


15,50 -16,00 
0,50 


= 100% . (0(-l) - <D(-2)) = 100% . (0,1587 - 0,0227) = 13,60%. 
Analogamente, obtemos: 

Percentual M (16,00) = 100% . P[ 15,50 < Y < 16,00] = 34,13%. 

Percentual G (16,50) = 100% . P[ 16,00 < Y < 16,50] = 34,13%. 

Percentual GG (17,00) =100% . P[ 16,50 < Y < 17,00] = 13,60%. 

b) Somando os percentuais: 2,27 + 13,60 + 34,13 + 34,13 + 13,60 = 97,73%. Assim 
sendo, os percentuais não somam 100% e sim 97,73%. A explicação para isso é 
que todos aqueles que tiverem a circunferência do pescoço acima de 17,00 - 
0,75, ou seja, acima de 16,25 polegadas não caberão em nenhum desses cinco ta¬ 
manhos de camisa. Eles representam 2,27% da população. 


EXERCÍCIOS PROPOSTOS 

4.1_P) Conceitos probabilísticos 

Para cada uma das afirmações a seguir responda se ela está ou não correta e por quê. 

a) O desvio-padrão de uma variável aleatória é sempre um número não negativo. 

b) Dois eventos mutuamente exclusivos são necessariamente independentes. 

c) Se uma certa variável obedece a uma curva Normal, em aproximadamente 68% 
dos casos os valores observados dessa variável estão distanciados da média de no 
máximo um desvio-padrão. 
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4.2_P) Aposta 

Alguém propôs a você participar de um jogo cujas regras são as seguintes: 

Você terá que lançar um dado tantas vezes quanto for necessário até obter um 6 pela pri¬ 
meira vez. Cada lançamento do dado vai lhe custar R$10,00. Se você conseguir obter um 6 
em no máximo 3 tentativas, ganhará um prêmio de R$ 100,00. O jogo termina no momento 
em que você obtiver o primeiro 6 ou quando você completar sem sucesso as 3 tentativas. 

a) Caso você aceite participar desse jogo, a sua expectativa de ganho líquido é posi¬ 
tiva? Justifique a sua resposta. 

b) Qual deveria ser o valor do prêmio (ao invés dos R$ 100,00) para que a expectati¬ 
va de ganho líquido fosse nula? 

c) Calcule o desvio-padrão do ganho líquido nas condições do item (b). 

Sugestão: Para cada possibilidade, analise qual seria o seu ganho líquido e qual a proba¬ 
bilidade de isso acontecer. 

4.3_P) Futebol - Batendo penalties 

Um jogador de futebol vai cobrar 3 penalties seguidos. 

Admita que: 

a) a probabilidade de ele converter a primeira cobrança é 0,70; 

b) a probabilidade de ele converter a segunda cobrança é igual a: 

• 0,80, se ele tiver convertido a primeira cobrança; 

• 0,60, caso contrário; 

c) a probabilidade de ele converter a terceira cobrança é igual a: 

• 0,90, caso ele tenha convertido as duas primeiras; 

• 0,70, caso ele tenha convertido somente uma das duas primeiras; 

• 0,50, caso ele não tenha convertido nenhuma das duas primeiras. 

Seja X o n 2 total de gols que o jogador vai fazer. 

a) Obtenha a função de probabilidade de X. 

b) Determine a média e o desvio-padrão de X. 

4.4_P) Alternativas de aplicação financeira 

Suponha que um investidor está considerando duas possibilidades de aplicação do 
seu capital. Na alternativa A ele investiria em uma ação cuja taxa de retorno é uma va¬ 
riável aleatória com distribuição Normal de média 15% e desvio-padrão 2%. Na alterna- 
liva B ele apostaria em um jogo onde a taxa de retorno é igual a 16% com probabilidade 
0,6 e igual a 13% com probabilidade 0,4. 

a) Em qual das duas alternativas seria maior o seu retorno esperado? Por quê? 

b) Em qual das duas alternativas seria maior a variância do seu retorno? Porquê? 

c) Imagine uma alternativa C para esse investidor onde ele apostaria em outro jogo 
com Laxa de retorno igual a j% com probabilidade 0,5 e igual a k% com probabi¬ 
lidade 0,5. Obtenha os valores de j e k para que o valor esperado e a variância do 
retorno na alternai iva C sejam respectivamente iguais ao valor esperado e à va¬ 
riância do retorno na alternativa A. 
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4.5_P) Tiro ao alvo 

Um atirador fez uma aposta com um amigo: ele atiraria no alvo 10 vezes e ganharia a 
aposta se conseguisse acertar na mosca pelo menos 8 vezes. Sabe-se, com base no de¬ 
sempenho usual desse atirador, que ele costuma acertar na mosca em 70% das vezes. 
Qual a probabilidade de que o atirador ganhe a aposta? 


4.6_P) Como reconhecer a lei binomial? 

Considere as variáveis aleatórias discretas X, Y e Z, cujas funções de probabilidade 
são dadas pela tabela a seguir: 


Variável 

p(0) 

P(l) 

P(2) 

P(3) 

P(4) 

P(S) 

X 

0,16666 

0,16667 

0,16667 

0,16667 

0,16667 

0,16666 

Y 

0,07776 

0,2592 

0,34560 

0,23040 

0,07680 

0,01024 

Z 

0,04762 

0,09524 

0,14286 

0,19048 

0,23809 

0,28571 


Qual dessas variáveis segue uma distribuição binomial e qual é o valor da probabili¬ 
dade de sucesso p nesse caso? 


4.7_P) Chegadas de navios a um porto 

Admita que o número de chegadas de navios a um porto durante um dia se comporta 
segundo uma distribuição de Poisson. Sabe-se também que, considerando somente os 
dias em que chegam no máximo 2 navios, em 60% desses dias chega no máximo 1 navio. 

a) Qual o número médio diário de chegadas de navios a esse porto? 

b) Considerando apenas os dias em que chegam pelo menos 2 navios, em quantos 
por cento desses dias costumam chegar pelo menos 3 navios? 

4.8_P) De quanto tempo se precisa para atender um cliente em uma loja? 

O tempo gasto no atendimento dos clientes de uma loja de roupas segue uma distri¬ 
buição exponencial cuja média é de 15 minutos. 

a) Qual a probabilidade de que o tempo de atendimento de um determinado clien¬ 
te selecionado ao acaso seja de pelo menos 30 minutos? 

^ Qual o valor dc 0 para que um cliente seja atendido em no máximo 0 minutos 
com 98% de probabilidade? 

4.9_P) Distribuição das alturas de jogadores de basquetebol 

Admita que a distribuição dc altura entre os jogadores de basquetebol é uma Normal 
com desvio-padrão 20 cm. Sabe-se que 40% desses jogadores têm mais de 2 m de altura. 

a) Determine a média dessa distribuição. 

b) Que percentagem dos jogadores tem menos de 1,80 m de altura? 

4. 10_P) Teste amostrai para concretização ou não de uma venda 

Admila que em condições normais o conteúdo (em mg/ml) de uma certa substância 
S no fluido F se comporta como uma Normal de média 87 e desvio-padrão 2. A Compa- 
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nhia A compra barris contendo esse fluido F, porém, antes de efetuar a compra, extrai 
uma pequena amostra do fluido e mede o respectivo conteúdo de S. Caso esse valor es¬ 
teja entre 82 e 92, a compra é efetuada. Caso contrário, aquele barril é rejeitado. 

a) Qual a probabilidade de que um barril de F, com conteúdo de S em condições 
normais seja realmente comprado? 

b) Qual a probabilidade de que, em uma remessa de 100 barris, todos eles com o con¬ 
teúdo de S em condições normais, pelo menos um desses barris seja rejeitado? 


CAPÍTULO 5 


VARIÁVEIS ALEATÓRIAS 
MULTIDIMENSIONAIS 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Distribuição conjunta 

• Função de probabilidade conjunta 

• Distribuições marginais e distribuições condicionais 

• Covariância e coeficiente de correlação 

• Esperança de uma função de duas variáveis aleatórias 

• Independência de variáveis aleatórias 

• Valor esperado e variância da soma de normais independentes 

• Variáveis aleatórias independentes e identicamente distribuídas (iid) 


Eurico é o gerente de vendas de uma concessionária de automóveis. Por sua orientação, a loja 
vem mantendo semanalmente em estoque dois carros importados e três de fabricação nacional, 
para atender aos seus clientes. Os carros vendidos são repostos no início de cada semana. Assim 
procedendo, ele acredita estar seguindo uma estratégia que se ajusta adequadamente à deman¬ 
da do mercado. Eurico procura manter um acompanhamento permanente e rigoroso das ven¬ 
das, não se esquecendo de registrar também os casos em que um cliente está disposto a comprar 
um carro, embora não consiga encontrá-lo no estoque. Isso lhe permite dispor de um perfil esta¬ 
tístico da demanda, por meio do qual ele pode ver respondidas algumas perguntas, para uma se¬ 
mana considerada típica: 

• Qual a probabilidade de que sejam vendidos mais carros importados do que 
nacionais? 

• Qual a probabilidade de que sejam vendidos ao todo pelo menos quatro carros? 

• Qual a probabilidade de que um comprador de carros importados não possa ser 
atendido? 

• Qual a probabilidade de ter de repor o estoque total no início da próxima semana? 
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• Qual a probabilidade de que todos os carros importados do estoque tenham sido 
vendidos, dado que somente um carro nacional foi vendido? 

• Há uma correlação positiva ou negativa entre a demanda por carros importados e 
carros nacionais? Elas crescem juntas? Ou, quando uma cresce, a outra diminui? 

Veremos a seguir neste capítulo, como questões desse tipo podem ser abordadas através da 
Teoria de Probabilidades. 


Dadas duas ou mais variáveis aleatórias definidas em um mesmo espaço amostrai, 
pode existir uma relação de dependência entre elas. Para estudar essa interdependência 
introduz-se o conceito de distribuição conjunta de variáveis aleatórias. 

No caso de apenas duas variáveis aleatórias X e Y, podem ser introduzidos, tanto no 
caso discreto como no caso contínuo, conceitos tais como: 

• função de distribuição acumulada conjunta de X e Y; 

• função de probabilidade (no caso discreto) ou de densidade (no caso contínuo) 
conjunta de X e Y; 

• função de probabilidade (no caso discreto) ou de densidade (no caso contínuo) 
condicional de X dado Y ou de Y dado X; 

• covariância entre X e Y; 

• coeficiente de correlação entre X e Y etc. 

No caso de variáveis aleatórias contínuas, um estudo mais aprofundado desses te¬ 
mas exigiria o uso de um ferramental matemático ainda mais complexo do que o envol¬ 
vido no estudo da análise univariada. Portanto, seguindo o mesmo enfoque do Capítulo 
4, não serão abordados aqui tópicos que envolveriam o uso do Cálculo Diferencial e In¬ 
tegral, como, por exemplo, considerações sobre a função de densidade conjunta 
(x,y)—>f(x,y), a função de distribuição acumulada conjunta (x,y)—»F(x,y), covariância 
e correlação para variáveis aleatórias contínuas. 

5.1 O CASO DE DUAS VARIÁVEIS ALEATÓRIAS DISCRETAS 

5.1.1 Funções de Probabilidade Conjunta e de Distribuição Acumulada 
Conjunta 

Consideremos duas variáveis aleatórias discretas X e Y, cujos conjuntos de valores são, 
respectivamente, fx,, x 2 ,...,x,} e {y,, y 2 ,...,y,}. 


A função de probabilidade conjunta de X e Y é a função p que associa a cada par 
(x,,y,) a probabilidade de que, ao mesmo tempo, X seja igual a x, e Y seja igual a y p 
ou seja, 

p(x„ y ( ) = P[X = x„Y = y j l 
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A função dc distribuição acumulada conjunta clc X e Y é a função I que assot ia a 
cada par (x,y) de números reais a probabilidade 

F(x, y) = P[X<x,Y<y|. 


Consideremos, então, novamente a situação que foi usada na abertura desie capítulo 

EXEMPLO 5.1: Vendas semanais de carros importados e carros nacionais 
Sejam X e Y as variáveis aleatórias que representam respectivamente o número de 
carros importados e o número de carros nacionais que a concessionária mencionada 
vende ao longo de uma semana. Então, X pode assumir os valores 0,1,2 e Y os va¬ 
lores 0,1,2,3. Suponha também que a função de probabilidade conjunta de X e Y é dada 
pela tabela a seguir: 


TABELA 5.1 Função de probabilidade conjunta de X e Y 


X 


/ 

0 

1 

2 

3 

0 

0,01 

0,05 

0,05 

0,04 

1 

0,05 

0,20 

0,15 

0,10 

2 

0,04 

0,15 

0,10 

0,06 


onde o valor na posição (i,j) corresponde à probabilidade conjunta de X = i e Y = j, sendo 
ie {0,1,2} ej e {0,1,2,3}. Por exemplo, a probabilidade de a concessionária não vender 
nenhum carro em uma semana, ou seja, P(X = 0 e Y = 0) é igual a 0,01; enquanto a pro¬ 
babilidade de que ela venda todo o seu estoque em uma semana, a saber, P(X = 2 e Y = 3) 
é igual a 0,06. 

Qual a probabilidade de que, em uma determinada semana: 

a) Não seja vendido nenhum carro importado? 

b) Todos os carros nacionais sejam vendidos? 

c) Sejam vendidos no máximo um carro importado e um carro nacional? 

d) Sejam vendidos mais carros importados do que nacionais? 

e) Sejam vendidos ao todo pelo menos quatro carros? 

Solução: 

a) P[X = 0] = P[X = 0,Y = 0j + P[X = 0,Y = lj + P[X = 0,Y = 2] + P(X = 0,Y = 3] = 
= 0,01 + 0,05 + 0,05 +0,04 = 0,15 

b) P[Y=3] = P[X=0,Y=31 + P[X=1,Y=3] + P[X=2,Y=3] = 

= 0,04 + 0,10 + 0,06 = 0,20 

c) P[X < 1, Y < 1] = P[X=0,Y=0] + P[ X=0,Y=11 + P[X=1,Y=0] + P[X=1 Y=l] = 

= 0,01 + 0,05 + 0,05 +0,20 = 0,31 

d) P[X>YJ = P[X=1,Y=0] + P[X=2,Y=0] + P[X=2,Y=1] = 

= 0,05 + 0,04 + 0,15 = 0,24 

e) P[X+Y > 4] = P[X=1,Y=3] + P[X=2,Y=2] + P[X=2,Y=3] = 

= 0,10 + 0,10 + 0,06 = 0,26 
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Conforme foi dito no enunciado do exemplo, a Tabela 5.1 representa a distribuição 
conjunta de X e Y. O item (c) usa o conceito de função de distribuição acumulada con¬ 
junta de X e Y no ponto (1,1). Os itens (a) e (b) introduzem o conceito de distribuição 
marginal, definido a seguir. 


5.1.2 Distribuições Marginais 


Dada a função de probabilidade conjunta das variáveis aleatórias X e Y: 

A distribuição marginal de X associa a cada valor x de X a soma das probabili¬ 
dades conjuntas de (x,y) para todos os possíveis valores y de Y. 

A distribuição marginal de Y associa a cada valor y de Y a soma das probabili¬ 
dades conjuntas de (x,y) para todos os possíveis valores x de X. 


EXEMPLO 5.2: Vendas de carros importados e nacionais (cont.) 

Retomando o exemplo anterior: 

A distribuição marginal de X está na última coluna da tabela a seguir. Nesta coluna 
cada valor corresponde à soma das probabilidades na respectiva linha. O cálculo da 
probabilidade marginal P(X = 0) foi visto no item (a) do Exemplo 5.1 e encontra-se na 
primeira célula da última coluna. 

A distribuição marginal de Y está na última linha da tabela a seguir. Nesta linha, cada 
valor corresponde à soma das probabilidades da respectiva coluna. O cálculo da proba¬ 
bilidade marginal P(Y = 3) foi visto no item (b) do Exemplo 5.1 e encontra-se na quarta 
célula da última linha. 


TABELA 5.2 A função de probabilidade conjunta e as marginais de X e de Y 


X 



P(X=x) 

0 

/ 

2 

3 

0 

0,01 

0,05 

0,05 

0,04 

0,15 

1 

0,05 

0,20 

0,15 

0,10 

0,50 

2 

0,04 

0,15 

0,10 

0,06 

0,35 

P(Y=y) 

0,10 

0,40 

0,30 

0,20 

1,00 


5.1.3 Distribuição Condicional de Variáveis Aleatórias Discretas 

Outro conceito vinculado à distribuição conjunta de duas variáveis aleatórias é o de dis¬ 
tribuição condicional. 


Distribuição condicional de Y dado X 

É formada pelas probabilidades condicionais de Y = y j7 dado que X = x p para todos 
os possíveis valores x, de X e y, de Y, denotadas por P(Y = y,l X = x ; ) e calculadas por: 


P(Y = y,l X = x,) = 


P(X = x,, Y = y,) 
P(X = x.) 
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Analogamente define-se a distribuição condicional de X dado Y. 


EXEMPLO 5.3 Ainda a venda de carros nacionais e importados 

No exemplo das vendas de carros pela concessionária, podemos agora calcular a pro¬ 
babilidade condicional colocada no início do capítulo. A probabilidade condicional de 
que, em uma dada semana, todos os carros importados do estoque tenham sido vendi¬ 
dos, dado que somente um carro nacional foi vendido, seria: 


P[X = 2|Y = 1] 


P[X=2,Y = 1] _ 0,15 _ 
P[Y = 1] 0,40 


Na tabela a seguir encontra-se a distribuição condicional de Y dado X, em que, em 
cada posição da tabela, a probabilidade é calculada dividindo-se o valor que ocupa a 
mesma posição na Tabela 5.2 pela marginal da linha correspondente. 


TABELA 5.3 Distribuição de probabilidade condicional de Y dado X 


X 

y 

0 

1 

2 

3 

0 

0,067 

0,333 

0,333 

0,267 

1 

0,100 

0,400 

0,300 

0,200 

2 

0,1 14 

0,429 

0,286 

0,171 


A distribuição condicional de X dado Y é obtida de maneira análoga: 

TABELA 5.4 Distribuição de probabilidade condicional de X dado Y 


X 

' 


0 

1 

2 

3 

0 

0,100 

0,125 

0,167 

0,200 

1 

0,500 

0,500 

0,500 

0,500 

2 

0,400 

0,375 

0,333 

0,300 


5.1.4 Covariância e Coeficiente de Correlação no Caso Discreto 

Dada a função de probabilidade conjunta entre as variáveis aleatórias discretas X e Y, cujos 
conjuntos de valores são, respectivamente, {x„ x,„..,x,} e |y„ y 2 ,...,yj}, calculam-se: 


• a covariância entre X e Y por 

Cov(X,Y) = ££(x, -E(X))(y -E(Y))P[X = x,, Y = y , ] 

l-l j-1 

•o coeficiente de correlação entre X e Y por 

p(X, Y) = C ° V (X, Y)_ 

VVar(X) • Var(Y) 
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EXEMPLO 5.4: Vendas de carros importados e nacionais (cont.) 

Retomando o exemplo anterior, tínhamos 


A função de probabilidade conjunta e as marginais de X e de Y 


X 


/ 

P(X=x) 

0 

/ 

2 

3 

0 

0,01 

0,05 

0,05 

0,04 

0,15 

1 

0,05 

0,20 

0,15 

0,10 

0,50 

2 

0,04 

0,15 

0,10 

0,06 

0,35 

R ( Y = y ) 

0,10 

0,40 

0,30 

0,20 

1,00 


Neste caso: 

E(X) = 0 x 0,15 + 1 x 0,50 + 2 x 0,35 = 1,20 

Var(X) = (0 - 1,20) 2 x 0,15 + (1 - 1,20) 2 x 0,50 + (2 - 1,20) 2 x 0,35 = 0,46 

E(Y) = 0 x 0,10 + 1 x 0,40 + 2 x 0,30 + 3 x 0,20 = 1,60 

Var(Y) = (0 - 1,60) 2 x 0,10 + (1 - 1,60) 2 x 0,40 + (2 - 1,60) 2 x 0,30 + (3 - 1,60) 2 

x 0,20 = 0,84 

Cov(X, Y) = (0 - 1,20) x (0 - 1,60) x 0,01 + (1 - 1,20) x (0 - 1,60) x 0,05 + 

+ (2 - 1,20) x (0 - 1,60) x 0,04 + (0 - 1,20) x (1 - 1,60) x 0,05 + (1 - 1,20) x 

x (1 - 1,60) x 0,20 + (2 - 1,20) x (1 - 1,60) x 0,15 + (0 - 1,20) x (2 - 1,60) x 0,05 + 

+ (1 - 1,20) x (2 - 1,60) x 0,15 + (2 - 1,20) x (2 - 1,60) x 0,10 + (0 - 1,20) x 

x (3 - 1,60) x 0,04 + (1 - 1,20) x (3 - 1,60) x 0,10 + (2 - 1,20) x (3 - 1,60) x 0,06 = 

= -0,06 

p(X, Y) = , ~° ,Q6 _ = -0,09652 

V0,46 x 0,84 

Vemos então que a correlação entre X e Y é ligeiramente negativa, isto é, quando aumentam 
as vendas de carros importados, as vendas de carros nacionais tendem a diminuir. ■ 

5.1.5 Valor Esperado de uma Função de Duas Variáveis Aleatórias 
Discretas 

Suponha que: 

• X e Y são variáveis aleatórias discretas que assumem, respectivamente, os valores 
x,, x 2 , x 3 ,..., x, e y,, y 2 , y 3 ,..., yj e cuja função de probabilidade conjunta é p(.,.); 

e 

• h é uma função real de duas variáveis reais. 

Então Z = h(X,Y) é também uma variável aleatória discreta, e seu valor esperado 

pode ser calculado por EÍZ) = E(h(X, Y)) = ^h (x„ y ( ) p (x„ y,). 

í.j 

Observação: Podemos ver, pela própria lorina como se calcula a covariãncia entre X e 
Y que esta implícito nesse cálculo o uso da expressão 

C.ovíX, Y) = H|(X - E(X))(Y - E(Y))| 
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5.2 INDEPENDÊNCIA DE VARIÁVEIS ALEATÓRIAS 

Dizemos que as variáveis aleatórias X e Y são independentes se a limcao <b d i n r iLm 
ção acumulada conjunta de X e Y é igual ao produto tias (unções de dist ribuiça» - mmi 
ladas de X e de Y isoladamente. Essa delinição vale tanto para o caso dist rei o ' omo p^ra 
o caso contínuo. Colocando essa definição em uma linguagem matemáii< a, u mos. 


Duas variáveis aleatórias X e Y são independentes se a função de distribuição at u 
mulada conjunta é calculada por: 

F(x,y)= P(X < x, Y < y) = P(X < x )P (Y < y ), 
para quaisquer x e y do conjunto dos números reais. 


5.2.1 O caso discreto 

No caso de variáveis aleatórias discretas, pode-se dizer também que X e \ são inde¬ 
pendentes se 

P[X = x i ,Y = y J ] = P[X = x i ] . P[Y = yj], 
para todo par (x, , Yj ) de valores possíveis de X e Y. 

Conseqüentemente, se X e Y são independentes 

P [Y = yj |X = xj = P [Y = Yj ] 

P [X = x,|Y = Yj ] = P [X = x t ] 

EXEMPLO 5.5: Duas concessionárias independentes 

Alterando um pouco o exemplo anterior, suponha que agora temos duas concessio¬ 
nárias, uma delas trabalhando com carros importados e a outra com carros nacionais, 
sendo que elas mantêm estoques semanais de, respectivamente, dois e três carros, como 
antes. Admitiremos também que as duas concessionárias são suficientemente afastadas 
entre si, de modo que a demanda pelos carros de uma não exerce influência sobre a de¬ 
manda pelos carros da outra. Suponha a seguinte distribuição de probabilidade: 


TABELA 5.5 Distribuição conjunta de X e Y, independentes 


X 

y 

P(X=x) 

0 

/ 

2 

3 

0 

0,015 

0,060 

0,045 

0,030 

0,15 

1 

0,050 

0,200 

0,150 

0,100 

0,50 

2 

0,035 

0,140 

0,105 

0,070 

0,35 

R ( Y = y ) 

0,10 

0,40 

0,30 

0,20 

1,00 


Observe que agora a probabilidade conjunta corresponde ao produto das probabili¬ 
dades marginais. Desta forma: 

E(X) = 0 x 0,15 + 1 x 0,50 + 2 x 0,35 = 1,20 
E(Y) = 0 x 0,10 + 1 x 0,40 + 2 x 0,30 + 3 x 0,20 = 1,60 
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Cov(X,Y) = (0 - 1,20) X (0 - 1,60) x 0,015 + (1 - 1,20) x (0 - 1,60) x 
x 0,05+ (2- 1,20) x (0 - 1,60) x 0,035 + (0 -1,20) x (1-1,60) x 
x 0,06 + (1 -1,20) x (1 -1,60) x 0,20 + (2 -1,20) x (1 - 1,60) x 0,14 + (0-1,20) x 
x (2 - 1,60) x 0,05 + (1 - 1,20) x (2 -1,60) x 0,15 + (2 - 1,20) x (2 - 1,60) x 0,10 + (0 -1,20) x 
x (3 - 1,60) x 0,03 + (1 -1,20) x (3 -1,60) x 0,10 + (2 -1,20) x (3 -1,60) x 0,07 = 0 

Então, obrigatoriamente, p(X, Y) = 0 


O conceito de v.a. discretas independentes, tal como foi definido anteriormente, 
pode ser generalizado para um número n qualquer de variáveis. 

5.2.2 O Caso Contínuo 

Vamos agora estender o conceito de independência para o caso de n v.a.s contínuas. 
Para isso adotaremos a seguinte notação: se 1 é o intervalo [a, b], escreveremos P(X e I) 
para expressar P(a < X < b). 


As variáveis aleatórias Xj , X 2 , ... , X n são independentes se 

P(X t e I, ,X 2 e I 2 .X n e I n ) = P(X, e I, )P (X 2 g I 2 )...P(X n e I n ), 

para quaisquer intervalos I 2 ,1 2 , . . , I„ 


Esse conceito é usado em diversos tipos de problemas, tanto práticos quanto teóricos. 


As variáveis aleatórias X,, X 2 , X 3 ,..., X n são ditas independentes e identicamente 
distribuídas (abreviadamente, iid), se todas elas obedecem ao mesmo modelo 
probabilístico e são independentes entre si. 


Esse é um conceito importante em Estatística e será examinado com mais detalhes 
nos capítulos que se seguem. 

EXEMPLO.5.6: Projetando o nível de precipitação de chuva para os anos 
vindouros 

Sabe-se que a precipitação anual de chuva em uma determinada região é uma variá¬ 
vel aleatória normalmente distribuída, com média de 26,8 cm e desvio-padrão de 2,6 
cm. Determine a probabilidade de que em cada um dos três próximos anos a precipita¬ 
ção anual ullrapasse 28 cm. 

Solução: 

Sejam X,, X 2 , X 3 as variáveis aleatórias que representam as precipitações anuais em 
< ada um dos três próximos anos. Cada variável terá distribuição Normal com média 
26,8 cm e desvio-padrão 2,6 cm. Podemos supor independência de um ano para o ou¬ 
tro. Assim, o que precisamos e calcular 
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P(X, > 28, X 2 >28, X 3 > 28) = P(X, > 28). P(X 2 > 28). P(X S > 28) = (PfX, > 28)} ' 
Ora, 

P( X, > 28) = 1 - P(X, < 28) = 1 - P( Z < 28 ~ 26 i^) = 1 - P(Z < 0,46) =1 - 0,678 = 0,322 

2,6 

Assim sendo, a probabilidade pedida é 0,322 3 = 0,0335 ou 3,35%. ■ 

5.2.3 Soma de Variáveis Aleatórias Normais Independentes 

Uma das propriedades mais interessantes e úteis da distribuição Normal é a chamada 
propriedade reprodutiva, no sentido de que a soma de variáveis aleatórias Normais in¬ 
dependentes é também uma Normal. 

Consideremos o caso geral de n variáveis aleatórias X,, X 2 , ....,X n com 

E(Xj) = Pi e Var(Xj) = a^, 
para todo i = 1, 2, ....,n. 

Dadas as constantes c,, c 2 , c n , não todas nulas, seja 
Y = c,X, + c 2 X 2 +.... + c n X n . 

Usando propriedades a serem apresentadas adiante, na Subseção 5.3.1, demons¬ 
tra-se que 

E(Y) = p Y = c,p,+ c 2 p 2 +— + c n p n (Propriedades (a) e (b)). 

Além disso, se as X, forem independentes, (pelas propriedades (g) e (h)), 

Var(Y) = a 2 =c 2 a 2 +c 2 o 2 +...+c 2 a 2 e 
DP(Y) = a Y = ^cfa} + c 2 a 2 +...c 2 a 2 

Se, adicionalmente, todas as X ( têm distribuição Normal, com as médias e variâncias 
indicadas, então Y tem também distribuição Normal, com média p Y , variância a 2 e des¬ 
vio-padrão a Y dados pelas expressões anteriores. 

EXEMPLO 5.7: Será que o elevador aguenta? 

Suponha que, para uma população de adultos, o peso seja uma variável aleatória nor¬ 
malmente distribuída, com média 75 kg e desvio-padrão 8 kg. Além disso, suponha 
que, para adultos praticantes de sumô, a distribuição dos pesos é também Normal, com 
média 110 kg e desvio-padrão 5 kg. Sete adultos comuns e três praticantes adultos de 
sumô estão prestes a entrar num elevador com a seguinte inscrição: “Capacidade máxi¬ 
ma 10 pessoas ou 850 kg”. Determine a probabilidade de que o peso dessas 10 pessoas 
ultrapasse a capacidade máxima do elevador. Se você fosse uma das pessoas comuns à 
espera do elevador, entraria nele junto com as outras nove pessoas? 

Solução: 

Os pesos dos sete adultos comuns podem ser considerados como uma amostra aleatória 
X[, X 2 , X„ X*, X 5 , X^,, X 7 de uma distribuição N(75; 8-), enquanto os pesos dos três pratican¬ 
tes de sumô podem ser considerados como uma amostra aleatória Y,, Y 2 , Y 3 de uma distri¬ 
buição N(1 10; 5 2 ). Sejam W=X 1 +X 2 +X 3 +X 4 +X 3 +X f ,+X 7 e T = Y,+Y 1 + Y 3 . Então: 
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Pw = 7x75 = 525; ct w =V7 x 8 2 = 21,2; p T = 3x110 = 330 e ct t = V3x5 2 =8,7 

Além disso, W e T são normalmente distribuídos. Seja S = W + T. S é também normal¬ 
mente distribuída, com média p s = p w + p T = 855 kg e desvio-padrão ct s = V21,2 2 + 8,7 2 = 
22,87 kg. 

Assim sendo, 

f 850-855^ 


P(S > 850) = P 


Z> 


22,87 


= P(Z > -0,219) = 0,587 ou 58,7%. 


Portanto, há uma probabilidade acima de 50% de que a carga máxima do elevador 
seja ultrapassada e, realmente, não vale a pena arriscar. H 


5.3 PROPRIEDADES DAS MEDIDAS DE CENTRALIDADE, DE 
DISPERSÃO E DE INTERDEPENDÊNCIA 

5.3.1 Algumas propriedades da Esperança, da Variância etc. 

A esperança, a variância, a covariância e outros conceitos similares do Cálculo de Pro¬ 
babilidades gozam de várias propriedades, entre as quais estão as seguintes (enuncia¬ 
das de maneira informal): 

a) A esperança da soma é igual à soma das esperanças, i.e., E(X + Y) = E(X) + E(Y). 

b) A esperança de constante vezes variável é igual à constante vezes a esperança da 
variável, i.e., E(c . X) = c . E(X). 

c) A covariância é igual à esperança do produto menos o produto das esperanças, 
i.e., Cov(X,Y) = E(XY) - E (X) . E(Y). 

d) Se as variáveis X e Y são independentes, a esperança do produto é igual ao produ¬ 
to das esperanças, i.e., E(XY) = E(X). E(Y), o que implica que X e Y são não cor¬ 
relacionadas, ou seja, Cov(X,Y) = 0. 

e) Existe uma relação entre a esperança e a variância de uma variável X, a saber, 
Var(X) = E[(X- E(X)) 2 ] = E(X 2 ) - (E(X)) 2 . 

0 A variância da soma é igual à soma das variâncias mais duas vezes a covariância, 
i.e., Var(X + Y) = Var(X) + Var(Y) + 2Cov(X,Y). 

g) A variância de constante vezes variável é igual à constante ao quadrado vezes a 
variância da variável, i.e., Var(c . X) = c 2 Var(X). 

h) Se as variáveis X e Y são independentes, a variância da soma é igual à soma das 
variâncias, i.e., Var(X + Y) = Var(X) + Var(Y),. 

i) O coeficiente de correlação p(X,Y) está sempre entre -1 e +1. 

EXEMPLO 5.8: Casais com exatamente dois filhos 

Admitamos que as probabilidades de nascimento de filhos homens e filhas mulheres 
sao iguais, ou seja, 50% para cada sexo. 

Consideremos apenas casais que tenham dois filhos. Então cada uma das quatro pos¬ 
sibilidades de c ombinaçoes quanto aos sexos dos filhos (MM, ME, EM, II) tem 25% de 
chance de acontecei Seja X igual a 0 ou I conlorme o primeiro filho seja homem ou 
mulher. Seja V igual a 0 ou I conloi me o segundo li lho seja homem ou mulher. Então as 
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variáveis aleatórias X e Y são independentes, e cada uma delas tem distribuição de Ber 
noulli com p = 1/2. 

Daí E(X) = E(Y) = Vi e Var(X) = Var(Y) = (1/2) x (1/2) = 'A. 

X + Y representa o número de crianças do sexo feminino entre as duas. Verifica-se que 
X + Y pode assumir os valores 0,1 e 2 com probabilidades V4, Vi e ‘A, respectivamente. 

Então E(X + Y) = 0 x 1/4 + 1 x 1/2 + 2 x 1/4=1 = Vi + Vi = E(X) + E(Y), conforme prevê 
a propriedade (a). 

Var(X + Y) = 0 2 x 1/4+ l 2 x 1/2 + 2 2 xl/4-l 2 = Vi = V4 + V4 = Var(X) + Var(Y), conforme 
prevê a propriedade (h). 

XY representa uma variável que é igual a 1 se ambas as crianças são do sexo feminino 
e 0 caso isso não aconteça. Então XY pode assumir os valores 0 e 1 com probabilidades 
3 /4 e V4, respectivamente. 

Daí E(XY) = 0 x 3/4 +1 x 1/4 = 1/4 = Vi x Vi = E(X).E(Y), conforme prevê a propriedade (c). 


EXEMPLO 5.9: Casais com no máximo dois filhos 

Consideremos agora o conjunto dos casais que têm no máximo dois filhos. Admita¬ 
mos que, dentro desse contexto, cada uma das possibilidades em termos do número de 
filhos, a saber, 0 filho, 1 filho e 2 filhos têm a mesma probabilidade, ou seja, 1/3 para 
cada uma delas. 

Admitiremos novamente que as probabilidades de nascimento de filhos e filhas são 
iguais. 

Assim sendo, entre os que têm apenas 1 filho (o que ocorre com probabilidade 1/3), te¬ 
mos metade para cada sexo, isto é, 1/6 para 1 filho e 1/6 para uma filha. 

Analogamente, entre os que têm dois filhos (o que também ocorre com probabilida¬ 
de 1/3), de novo cada uma das quatro possibilidades de combinações dos sexos tem a 
mesma chance: dois homens têm probabilidade 1/12, duas mulheres têm probabilidade 
1/12, 1 homem e 1 mulher têm probabilidade 1/6. 

Seja X o número de filhos homens de um casal escolhido ao acaso. X pode ser 0,1 ou 
2, com probabilidades 7/12, 4/12 e 1/12, respectivamente. Por quê? 

Então, 

E(X) = 0 x 7/12 + 1 x 4/12 + 2 x 1/12 = 1/2 e 

Var(X) = O 2 x 7/12 + l 2 x 4/12 + 2 2 x 1/12 - (1/2) 2 = 5/12. 

Seja Y o número de filhas de um casal escolhido ao acaso. Então X e Y têm ambos a 
mesma distribuição de probabilidade, o mesmo valor esperado e a mesma variância. 

Mas agora X e Y não são mais variáveis aleatórias independentes. Por quê? Por exem¬ 
plo, porque P(X = 0, Y = 0) = 1/3 * 49/144 = (7/12) x (7/12) = P(X = 0).P(Y = 0). 

X + Y é o número total de filhos (de ambos os sexos) de um casal selecionado ao aca¬ 
so. Já vimos que, por construção, X + Y pode assumir cada um dos valores 0,1 ou 2 com 
probabilidade 1/3. Então 
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E(X + Y) = 0 X 1/3 + 1 X 1/3 + 2 X 1/3 = 1 e 

Var(X + Y) = O 2 x 1/3 + l 2 x 1/3 + 2 2 x 1/3 - l 2 = 2/3. 

Por outro lado, a variável XY só pode assumir os valores 0 e 1, com probabilidades 
5/6 e 1/6, respectivamente. Por quê? 

Daí 

E(XY) = 0 x 5/6 + 1 x 1/6 = 1/6 
Pela propriedade (0, temos 

Cov(X,Y) = E(XY) - E(X)E(Y) = 1/6 - (1/2).(1/2) =- 1/12 
Finalmente 

Var(X) + Var(Y) + 2Cov(X,Y) = 5/12 + 5/12 + 2 x (-1/12) = 2/3 = Var(X + Y), 
conforme prevê a propriedade (e). 


5.3.2 O Uso das Propriedades para Demonstrar Resultados Teóricos 

As propriedades matemáticas mostradas são muito úteis quando se trata de deduzir re¬ 
sultados teóricos relativos ao Cálculo de Probabilidades. Aqui estão alguns exemplos 
de tais resultados: 

1. Se X e Y são v.a.s independentes e tais que E(X) = p x E(Y) = p Y , DP(X) = a x e 
DP(Y) = a Y , então E(X - Y) = p x - p Y e DP(X - Y) = +crj. 

Esse resultado pode ser demonstrado usando-se as propriedades (a), (b), (g) 
e (h). 

2. Se X tem distribuição binomial com parâmetros n e p, então E(X) = np e 
Var(X) = np(l - p). 

Essa propriedade pode ser demonstrada expressando X como a soma de n 
v.a.’s iid, sendo cada uma delas Bernoulli(p), e usando as propriedades (a) e (h). 


3. Se X,, X 2 , X 3 ,..., X„ são n variáveis aleatórias independentes e identicamente dis¬ 



tribuídas (iid), com E(Xj) = p e Var(Xi) = a 2 , para todo i; e X = —- e 

n 


£(x, -x) ! 

S 2 = —-são, respectivamente, a média e a variância amostrais, então: 

n -1 

E(X) = p, Var(X) = — e E(S 2 ) = a 2 . 

n 


í.sses resultados nos serão muito úteis no Capítulo 7. A primeira afirmação pode ser 
demonstrada usando as propriedades (a) e (b), a segunda usando as propriedades (g) e 
íb), e a terceira usando as propriedades (a), (b) e (e). 
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RESUMO DO CAPÍTULO 5 

Sejam X e Y duas v. a.s discretas. Então: 

• A função de probabilidade conjunta p(.,.) de X e Y associa a cada par ( x ,y t ) a 
probabilidade de que, ao mesmo tempo, X seja igual a x, e Y seja igual a y r Sim¬ 
bolicamente: p(Xj, yj) = P[X = x,, Y = Yj] 

• A distribuição marginal de X associa a cada valor x de X a soma das probabili¬ 
dades conjuntas de (x,y) para todos os possíveis valores y de Y. Analogamente, 

define-se a distribuição marginal de Y. 

• A distribuição de probabilidade condicional de Y dado X é dada por 

P(X = x i ,Y = y j ) , v 

P(Y = y | X = x ) =- 5 - —, onde x t é um valor possível de X e y. e um va- 

J P(X = Xj ) 

lor possível de Y. Analogamente, define-se a distribuição de probabilidade con¬ 
dicional de X dado Y. 

• A covariância entre X e Y é dada pela expressão 
Cov(X,Y)=Ü;(x l —E(X)( Yj -E(Y))P[X = x i ,Y = y j ] 


í=i j=i 


O coeficiente de correlação entre X e Y é p(x, y) = 


Cov(X, Y) 


VVar(X) - Var(Y) 


Dadas duas variáveis aleatórias X e Y (discretas ou contínuas): 

• A função de distribuição acumulada conjunta de X e Y é a função F(.,.) que as¬ 
socia a cada par (x,y) de números reais a probabilidade F(x,y) = P [ X < x, Y < y ]. 

• X e Y são independentes se F(x,y)= P(X < x, Y < y) = P(X < x )P (Y < y), para 
quaisquer x e y do conjunto dos números reais. 

• As v.a.s discretas X e Y são independentes se 
P[X = Xj, Y = yj] = P[X = xj . P[Y = yj], 

para todo par (x,, y) de valores possíveis de X e Y. Conseqúentemente, se X e Y 
são independentes, 

P [Y = yj | X = x,] = P[Y = y j ]eP[X = x i | Y = yj ] = P [X = xj. 

• De uma forma geral, as n variáveis aleatórias contínuas X,, X 2 ,... , X n são inde¬ 
pendentes se PCX, e I, X 2 e I 2 .X n e I n ) = P(X, € 1, )P (X 2 e I 2 )..,P(X n e I n ), 

para quaisquer intervalos I,, I 2 , . . , I n 

• As variáveis aleatórias (discretas ou contínuas) X,, X 2 ,..., X n são ditas indepen¬ 
dentes e identicamente distribuídas (abreviadamente, iid), se todas elas obe¬ 
decem ao mesmo modelo probabilístico e são independentes entre si. 

• Dadas n variáveis aleatórias independentes X,, X 2 .X n com ECX*) = p, e Var(X,) 

= CTi 2 , para todo i = 1,2.,n e dadas as constantes c,, c 2 ,.c„ (não todas nulas), 

se Y = c,X, + c 2 X 2 +.... + c n X n , então E(Y) = p Y = c,p,+ c 2 p 2 +.... + c n p n 
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e DP(Y) = a Y = ,/cjõj" + c\g\ +...cí,a 2 n . Se, além disso, todas as X, têm distribuição 
Nonrial, com as médias e variâncias indicadas, então Y tem também distribuição 
Normal, com média p Y e desvio-padrão a Y dados pelas expressões anteriores. 

São propriedades da esperança, variância, covariância etc. as seguintes: 

• E(X + Y) = E(X) + E(Y). 

• E(c . X) = c . E(X). 

• Cov(X,Y) = E(XY) - E(X) . E(Y). 

• Se Xe Y são independentes, E(XY) = E(X). E(Y), o que implica que Cov(X,Y) = 0. 

• Var(X) = E[(X - E(X)) 2 ) = E(X 2 ) - (E(X)) 2 . 

• Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y). 

• Var(c . X) = c 2 Var(X). 

• Var(X + Y) = Var(X) + Var(Y), se X e Y são independentes. 

• O coeficiente de correlação p(X, Y) está sempre entre -1 e +1. 


EXERCÍCIOS RESOLVIDOS 

5.I_R) Pedidos de informação em um aeroporto 

Seja Z o número de pessoas em geral (nacionais ou estrangeiras) que recorrem ao 
balcão de informações de um aeroporto ao longo de uma hora. Sabe-se que: 

• o número X de usuários nacionais que recorrem a esse balcão em uma hora é uma 
variável aleatória cuja lei de probabilidade é Poisson com freqüência média de 
chegada X = 10 pessoas por hora; 

• o número Y de usuários estrangeiros que recorrem a esse balcão em uma hora se¬ 
gue também uma lei de probabilidade de Poisson com freqüência média de chega¬ 
da p = 4 pessoas por hora; 

• X e Y são variáveis aleatórias independentes. 

Determine: 

a) a lei de probabilidade de Z; 

b) a lei de probabilidade condicional de X dado que Z = z. 


Solução: 

a) P[Z = z1 = P[X + Y = z1=£p1X = x,Y = z-x]=£p[X =x]P[Y = z - x] 

x=0 x=0 


=x 


exp(-Á)Á* exp(-p)p' 
x! (z-x)! 


exp(-(X+p)) • — £ - z! X* p*' x = 
z! x=o x!(z - x)! 


exp( (X j- p ))(X + p v 

z! 


para todo z = 0,1 , 2 ,... 
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Observe que nesse desenvolvimento foram usados a independência enirc / < 1 a 

fórmula do binômio de Newton. (Ver Apêndice 1) 

Daí se conclui que a lei de probabilidade de Z é também uma Poisson, com fmqnrn- 

cia média de chegada X + p =14 pessoas por hora. 


b) 


P[X = x|Z = z] 


P[X = x,Z = zl _ P[X = x, Y = z - x] = P[X = x]P| Y = z - x ] 
P[Z = z] ~ P[Z = z] PlZ = z] 


(exp(-Z)À, x /x!^exp(-p)p z x /(z - x)l) 
exp(-(Z +p))(À. +p) z /z! 


z! 

í k T 

í * 1 

z-x 


1 

N 

"x 


<2. + p, 


l x J 


onde p =-, para todo x = 0,1,.. .z 

X + p 

Decorre então que a distribuição condicional de X dado que Z = z é uma Binomial 

(z;p), onde p = —. 

X +p 14 


5.2_R) Tempo de deslocamento da residência até o local de trabalho 

Considere uma pessoa que, toda manhã, faz uma viagem de carro desde sua residên¬ 
cia no subúrbio até a estação ferroviária e, dali, toma um trem rumo ao seu local de tra¬ 
balho no centro da cidade. Ela costuma sair de casa entre 7:00 e 7:30. O percurso de 
carro até a estação ferroviária leva entre 10 e 20 minutos. Admita que tanto o instante de 
partida quanto a duração do percurso de carro são variáveis aleatórias independentes, 
cada uma delas com distribuição uniforme no seu respectivo intervalo. Considere tam¬ 
bém que o tempo é contado em minutos a partir de 7:00. 

Então pode ser provado que a função de distribuição acumulada da variável aleatória 
Y, instante de chegada dessa pessoa à estação ferroviária, é dada por: 
r 

— (y-10)\ se 10 <y <20 

600 


F Y (y) =- 


— (y -15), 
30 


se 20 < y < 40 


1 1 ,-. ^ 


300 


300 —— (50 - y) 

2 j 


se 40 < y < 50 


e que a sua correspondente função de densidade é 
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fv(y) = 


300 

J_ 

30’ 


1 


1300 


(y - 10), se 10 < y < 20 


se 20 < y < 40 


(50-y), se 40 < y < 50 


Há três trens que ela pode tomar, sendo que todos eles são absolutamente pontuais em 
seus horários de partida e de chegada. O primeiro trem parte às 7:30 e chega às 8:20. O se¬ 
gundo trem parte às 7:45 e chega às 8:25.0 terceiro trem parte às 8:00 e chega às 8:45. 

Determine a média e o desvio-padrão do horário de chegada dessa pessoa ao centro 
da cidade. 


Solução: 

• Para que ela consiga tomar o primeiro trem, é necessário que chegue à estação fer¬ 
roviária no máximo até 7:30, o que corresponde a 30 minutos, a partir das 7:00. A 
probabilidade de que isso aconteça pode ser calculada como o valor da função de 
distribuição acumulada de Y no ponto y = 30: 

F y (30) =— (30-15) = - 
30 2 

Neste caso, ela chegaria ao centro da cidade às 8:20. 

• Para que ela perca o primeiro trem, mas consiga tomar o segundo é necessário que 
chegue à estação ferroviária entre 7:30 e 7:45, o que corresponde ao intervalo que 
vai desde 30 minutos até 45 minutos, a partir das 7:00. A probabilidade de que isso 
aconteça pode ser calculada como 

F y ( 45) - F y (30) = — f 300 - - (50 - 45) 2 1 —- (30 - 15) = — - - = — 

3001 2 ) 30 24 2 24 

Neste caso, ela chegaria ao centro da cidade às 8:25. 

• Para que ela perca os dois primeiros trens, sendo, portanto, obrigada a tomar o ter¬ 
ceiro trem é necessário que chegue à estação ferroviária após as 7:45, o que corres¬ 
ponde a 45 minutos, a partir das 7:00. A probabilidade de que isso aconteça pode 
ser calculada como 


1 - F y (45) 


1 1 .^ 


300 


300 - - (50 - 45) 
2 


y 


= 1-S 

24 


24 


Neste caso, ela chegaria ao centro da cidade as 8:45. 

Assim sendo, se W e a variável aleatória que corresponde ao momento em que ela 
chegará ao centro da cidade, contado em minutos a partir de 7:00, lemos: 
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80, com probabilidade - 


W=<j85, com probabilidade — 


105, com probabilidade ^ 


Ou, de outra forma, calculando as probabilidades como áreas sob a curva de f Y . 

p[W = 801 = P[10< Y<30] =-x —x (20-10)+ — x (30-20) = - 

2 30 30 2 

P[W = 85] = P[30 < Y < 451 = 

]_ 

30 


— x (40 - 30) + í- x — x (50 - 40) - - x — x (50 - 45) 
$0 U 30 2 60 


n_ 

24 


P[W = 105] = P[45 < Y < 50] = - x — x (50 - 45) = — 

2 60 24 

Daí, E(W) = 80xi + 85 x — + 105 x — = 83,33 minutos a partir de 7:00 e 
2 24 24 


DP(W) = 80 2 x - +85 2 x — + 105 2 x — -83,33 2 = 5,14 minutos. 

V 2 24 24 

Isso significa que o horário esperado da chegada ao centro é 8 horas, 23 minutos e 20 
segundos, com um desvio-padrão de 5 minutos e 8 segundos. 


5.3_R) Uma embalagem bem tampada 

Admita que o diâmetro da parte externa da boca circular de uma embalagem de latão 
de leite em pó é uma variável aleatória com distribuição Normal de média 8,5 cm e des¬ 
vio-padrão 0,003 cm. Tampas de plástico para essas embalagens têm diâmetros com 
distribuição Normal de média 8,51 cm e desvio-padrão 0,002 cm. Para um perfeito en¬ 
caixe, a diferença entre os diâmetros da tampa e da boca da embalagem não deve ser in¬ 
ferior a 0,005 cm e nem superior a 0,020 cm. Uma embalagem e uma tampa são 
escolhidas ao acaso. Qual a probabilidade de que elas não se encaixem corretamente? 

Solução 

Sejam X e Y as v.a.’s independentes que representam, respectivamente, os diâmetros 
da boca da embalagem e da tampa, ambas normalmente distribuídas. Temos 

Px = 8,5 cm, ct x = 0,003 cm, p Y = 8,51 cm, ct y = 0,002 cm. 

Sejam D = Y — X = Y + (—l)Xe p^e o D asua média eseu desvio-padrão, respectivamente. 

Então p D = pv + (-1) p x = p Y - p x = 0,01 e 
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= +(-D 2 ^ 2 x =V a v +° 2 v =a/o,003 2 +0,002 2 =0,0036 


Assim, a probabilidade de as duas peças se encaixarem perfeitamente é dada por 


P(0,005 < D < 0,02) = P 
= 0,9150 ou 91,50%. 


0,005-0,010 

0,0036 


< Z < 


0,020-0,010 

0,0036 


= P(-1,39<Z<2,78) = 


Então, a probabilidade de que a embalagem e a tampa não se encaixem é 
100-91,50 = 8,50%. 


EXERCÍCIOS PROPOSTOS 

5.1 _P) Os gastos podem exceder os ganhos? 

Para uma certa pessoa, os gastos mensais (em reais) com diversas categorias de bens 
e serviços podem ser considerados v.a.s independentes, com distribuições Normais e 
com as seguintes médias e desvios-padrão: 


Item 

Média 

D-Padrão 

Alimentação 

1500,00 

200,00 

T ransporte 

1000,00 

300,00 

Luz, gás, telefone 

500,00 

100,00 

TV a cabo 

150,00 

30,00 

Plano de saúde 

450,00 

50,00 

Vestuário 

300,00 

100,00 

Lazer 

400,00 

100,00 

Eletrodomésticos 

300,00 

100,00 

Moradia 

800,00 

200,00 

Remédios 

400,00 

100,00 


Acontece que o salário mensal líquido desse indivíduo é da ordem de 6.000,00 reais. 
Qual a probabilidade de que, em determinado mês, ele gaste mais do que recebeu? 

5.2_P) Número de pessoas e número de carros em uma família 

Consideremos a população formada por todas as famílias de uma determinada re¬ 
gião. Sorteando ao acaso uma dessas famílias, sejam X e Y, respectivamente, o número 
de pessoas e o número de automóveis dessa família. A tabela a seguir nos fornece a dis- 
tribuição condicional de X dado Y: 



Y 

X 

0 

/ 

2 

1 

0,25 

0,25 

0 

2 

0,35 

0,325 

0,15 

3 

0,25 

0,25 

0,5 

4 

0,125 

0,125 

0,25 

5 

0,025 

0,05 

0,1 
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Já a distribuição marginal de Y é a seguinte: 


y 

0 

/ 

2 

“D 

Q 

ii 

0,4 

0,4 

0,2 


a) Determine a distribuição marginal de X. 

b) Qual a probabilidade de que uma família sorteada ao acaso dessa população te¬ 
nha pelo menos três pessoas? 

c) Obtenha uma tabela com a distribuição condicional de Y dado X. 

d) Qual a probabilidade condicional de que uma família dessa população tenha no 
máximo um automóvel dado que ela é composta por quatro pessoas? 

e) Calcule o coeficiente de correlação entre X e Y. 

5.3_P) Multiplicação de partículas 

Um certo tipo de partícula se divide em 0,1 ou 2 novas partículas (que serão chama¬ 
das suas descendentes) com probabilidades 30%, 40% e 30%, respectivamente, e depois 
se desintegra. As partículas individuais agem independentemente entre si. Dada uma 
partícula, seja X 1 o número dos seus descendentes e seja X 2 o número de descendentes 
dos seus descendentes. 

Calcule: 

a) P(X 2 = 0) 

b) P(X, = 1|X 2 = 2) 

5.4_P) Detector de mentiras 

Um detector de mentiras será usado pela polícia para investigar dez suspeitos de en¬ 
volvimento em um determinado crime. Admita que entre eles cinco são culpados (mas 
alegarão inocência) e os outros cinco são realmente inocentes. Sabe-se também que: 

• mesmo quando uma pessoa diz a verdade, o detector tem uma chance de 5% de fa¬ 
lhar, indicando que ela mentiu; 

• mesmo quando ela mente, o detector tem uma chance de 30% de não conseguir 
detectar a mentira. 

Qual a probabilidade de que: 

a) todos os dez diagnósticos obtidos através do detector estejam corretos? 

b) o detector libere todos os dez suspeitos? 

c) ao mesmo tempo, pelo menos três dos culpados sejam pegos e pelo menos qua¬ 
tro dos inocentes sejam liberados? 

5.5_P) Saques em banco 24 horas 

Uma pessoa pretende fazer um saque no banco 24 horas que funciona perto da sua 
residência, onde há três máquinas que podem ser utilizadas. Suponha que o número X 
de pessoas que já chegaram antes dela e estão usando o serviço ou aguardando a sua vez 
pode ser modelado como uma variável aleatória com distribuição de Poisson com parâ¬ 
metro À, sendo: 
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A. = 1, entre 0:00 e 10:00 
A. = 2, entre 10:00 e 17:00 
A. = 3, entre 17:00 e 24:00 

Se essa pessoa chega em um determinado momento escolhido ao acaso, qual a proba¬ 
bilidade de que ela possa sacar imediatamente sem ter de esperar? 

Sugestão: 

Se Y é uma variável aleatória definida por 


Y H 


A, se a pessoa chega entre 0:00 e 10:00 

B, se a pessoa chega entre 10:00 e 17:00 

C, se a pessoa chega entre 17:00 e 24:00 


então 

a) Calcule P[Y = A], P[Y = B] e P[Y = C] 

b) Verifique, a partir do enunciado do problema, como você pode calcular 

P[X = k | Y = yl, onde k = 0,1,2,... e y = A, B ou C 


c) Use o fato de que, para qualquer conjunto K de números inteiros e não-nega¬ 
tivos 


P[XeK | Y = yl = P[XeK,Y = yl / P[Y = y] 
e 

P[XeK] = P[XeK,Y = A] + P[XeK,Y = B] + P[XeK,Y = C] 


5.6_P) Marcando um encontro 

Dois amigos combinaram de se encontrar em determinado local entre 14:00 e 16:00, 
sendo que cada um deles esperaria pelo outro no máximo até 15 minutos. Qual a proba¬ 
bilidade de que eles realmente se encontrem? 

Sugestão: 

Contando o tempo em minutos a partir das 14:00, o instante de chegada de cada um 
pode ser visto como uma v.a. uniforme no intervalo [0; 1201. Além disso, essas v.a.’s 
podem ser consideradas independentes. Desenhe uma figura em que cada eixo do pla¬ 
no bidimensional representa o instante de chegada de uma pessoa. Verifique qual é o 
subconjunto do quadrado [0; 120] x [0; 120] que corresponde a um encontro entre eles. 

5.7 P) No check-in do aeroporto. 

Eunice chega ao check-in de um aeroporto carregando uma mala que contém dez pa¬ 
cotes de café, cinco latas de leite em pó e sete latas de azeite. Suponha que os pesos des¬ 
ses nens sáo todos v.a.s independentes com distribuição Normal e com as seguintes 
médias e desvios-padrão: 

• Para os pacotes de cale, a média é 1.000 g e o desvio-padrão 15 g; 

• Para as latas de leite em pó, a média é 450 g e o desvio-padrão 8 g; 

• Para as latas de azeite, a média e 600 g e o desvio-padrão 12 g. 
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Supondo que o peso da mala c de 1,5 kg c que, além disso, Liunice ainda carn ga - a 
tos 2,0 kg de roupas, determine a probabilidade de que o peso tola) de sua bagagf m nl 
trapasse os 20 kg permitidos para o embarque. 

5.8_P) Controle de qualidade na produção de resistores 

Suponha que, em uma fábrica de componentes eletrônicos, a resistência elétrica em 
quiloohms dos resistores produzidos deve ser mantida estável com uma média p = 50 
e um desvio-padrão a = 10. Para controlar o processo produtivo, periodicamente são 
obtidas amostras de tamanho n = 5 resistores cujas resistências x,, x 2 , x 3 , x 4 , x 5 são me¬ 
didas, e se adota a seguinte regra de funcionamento: 

Se a média aritmética x dos cinco x> for inferior a 41 ou superior a 59, a produção é in¬ 
terrompida para verificar se o processo saiu de controle. 

Caso contrário, tudo continua normalmente. 

Admitindo que os valores medidos das resistências obedecem a uma lei de probabili¬ 
dades Normal com média p e desvio-padrão cr 

a) Calcule a probabilidade de haver uma parada desnecessária (ou seja, com p = 50) 
na produção. 

b) Calcule a probabilidade de uma desregulagem que leve a média para p = 40 
(mantendo a = 10) não ser detectada quando se usa a regra anterior. 



CAPITULO 6 


AMOSTRAGEM: UMA PONTE ENTRE 
PROBABILIDADE E INFERÊNCIA 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Amostragem aleatória simples 

• Amostragem probabilística e não probabilística 

• Amostragem com e sem reposição 

• Amostrai versus Populacional 

• Amostra Aleatória 

• Teorema Central do Limite 

• Aproximação da Binomial pela Normal 


Considere as duas situações a seguir: 

a) Uma instituição de caridade deseja realizar uma obra em sua sede, que custa 
R$3.500,00. Entre os contribuintes habituais dessa instituição, cada um pode 
ajudar com algo em torno de R$120,00 ± um desvio-padrão de R$50,00. Se 30 
dessas pessoas se quotizarem para levantar fundos com essa finalidade, será que 
há uma boa chance de a instituição conseguir levantar o montante necessário 
para a execução da obra? 

b) O governo decide incentivar a compra de casas por pessoas da terceira idade por 
meio da redução de impostos e outras facilidades para as construtoras que en¬ 
trem no programa. A casa seria paga durante 15 anos com financiamento da pró¬ 
pria construtora. A condição básica é que o empréstimo para a compra da casa 
inclua um seguro de desgravame, ou seja, se o adquirente falecer antes do fim das 
prestações, a casa fica automaticamente quitada. A construtora Casa Moderna 
estuda a possibilidade de entrar no programa com 50.000 casas. Ela estima que 
os compradores estarão, em sua maiot ia, na faixa dos 60 a 70 anos e, assim, ado¬ 
ta o critério de considerar como seu cliente padrão uma pessoa de 65 anos. Po¬ 
rém, antes de aderir ao programa, a Construtora desenvolve um estudo para 
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avaliar quantas pessoas estarão ainda vivas aoJinal dos 1 5 anos. De acordo com 
tabelas atuariais, sabe-se que a proporção de pessoas de 65 anos que sobrevivem 
até os 80 anos é aproximadamente de 60,9%. A Casa Moderna consideraria essa 
iniciativa compensadora se pelo menos 40.000 compradores pudessem pagar to¬ 
das as suas prestações. Será alta ou baixa a chance disso vir a acontecer? 


Em ambos os casos, aparentemente poderiam ser calculadas probabilidades usan¬ 
do métodos já estudados nos capítulos anteriores. Porém, a realidade não é assim tão 
simples. 

No caso (a), se a distribuição das contribuições individuais fosse Normal, bastaria aplicar a 
teoria correspondente à soma de Normais independentes. Mas, e se ela não for Normal ? 

No caso (b), a distribuição binomial parece ser a adequada para o cálculo das proba¬ 
bilidades, porém o volume de cálculo envolvido claramente seria enorme. 

Através do material a ser estudado neste capítulo, em particular o Teorema Central 
do Limite, questões como as colocadas aqui podem ser facilmente quantificadas. 

No presente capítulo: 

• analisaremos, através do Teorema Central do Limite, o comportamento da média 
amostrai à medida que cresce o tamanho da amostra; 

• estudaremos, em particular, a aproximação da distribuição binomial pela Normal; 

• apresentaremos algumas noções básicas sobre o processo de seleção dos elemen¬ 
tos de uma amostra; 

• discutiremos brevemente a diferença entre o que é amostrai e o que é populacional; 

• apresentaremos brevemente o que vem a ser Inferência Estatística. 

6.1 O TEOREMA CENTRAL DO LIMITE 

O Teorema Central do Limite (abreviadamente, TCL) diz respeito ao comportamento 
da média amostrai X n à medida que o tamanho n da amostra cresce indefinidamente. 

EXEMPLO 6.1: A distribuição de renda e o TCL 

É um fato conhecido que a distribuição da renda pessoal dos habitantes de um país é 
usualmente muito desigual, ou seja, muitos ganham pouco e poucos ganham muito. Se 
forem sorteados 200 habitantes desse país e, com base nas suas rendas mensais, cons¬ 
truirmos um histograma, ele terá o seguinte aspecto. 



FIGURA 6.1 A distribuição da renda individual mensal 
(em salários mínimos) em determinado país. 


















ELSEVIER 


AMOSTRAGEM: UMA PONTE ENTRE PROBABILIDADE E INFERÊNCIA I 57 


Agora, se forem sorteadas 200 amostras, cada uma delas contendo dois habitantes 
desse país, e se forem calculadas as 200 respectivas médias amostrais, a partir delas ob¬ 
teremos o histograma a seguir: 



0 2 4 6 8 

FIGURA 6.2 Histograma da média amostrai de renda X n , para n = 2. 

Por outro lado, se forem sorteadas 200 amostras, cada uma delas contendo 30 habi¬ 
tantes desse país, e se forem calculadas as 200 respectivas médias amostrais, a partir de¬ 
las pode ser construído este outro histograma: 



1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 

FIGURA 6.3 Histograma da média amostrai de renda X n , para n = 30. 

Como pode ser facilmente observado, no caso de n = 2, o histograma se aproxima 
mais de uma curva Normal do que no caso de n = 1. E no caso de n = 30, a semelhança do 
histograma com uma curva Normal é ainda maior. Por que será? 

■ 

Vamos então à teoria. 

Admita que um mesmo experimento, em que se observa o valor de uma determina¬ 
da variável, pode ser repetido seqüencialmente, sempre sob as mesmas condições. 
Matematicamente, temos uma seqüência infinita X,, X 2 , X 3 ,... de variáveis aleatórias 
independentes, iodas elas seguindo exatamente a mesma distribuição de probabilida¬ 
de. Então X,, X 2 , Xj,... são variáveis aleatórias independentes e identicamente distri¬ 
buídas fiid). 


SeX,,X 2 ,..., X„ são variáveis aleatórias iid, dizemos que elas formam uma amostra 
aleatória de tamanho n do fenómeno que estamos estudando. 


Sejam p e o J respectivamenle a média c a variância comuns a todas elas, ou seja, 
EfX,) = p e VaríX,) = n l , para lodo i = 1,2,... 
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Então, pode ser construída a partir dessa sequência de variáveis aleatórias iid uma 
outra seqüência de variáveis aleatórias X,, X 2 , X } ,... onde: 

X l+ X 2 


Xt =X, 


X 2 = 


X _ X l + X 2 + X 3 


Todas essas novas variáveis têm também a mesma média p, porém não a mesma va¬ 
riância. Na verdade, E(X n ) = p e Var(X n ) = a 2 /n , para todo n = 1,2.Portanto, a va¬ 

riância de X n tende a zero à medida que aumenta o tamanho n da amostra. 


Observação: Daí decorre que, quando o tamanho n da amostra cresce indefinidamente, 
a média amostrai X n se aproxima cada vez mais da média populacional p. 


O Teorema Central do Limite afirma que, independentemente de qual seja a dis¬ 
tribuição original dos X b a distribuição de probabilidade de X n e a distribuição 
Normal com média p e variância a 2 /n se aproximam cada vez mais uma da outra, à 
medida que n cresce. 


Portanto, mesmo que a distribuição de probabilidade dos X, seja desconhecida, o 
Teorema Central do Limite garante a possibilidade de usarmos o modelo Normal para 
calcular, ainda que de forma aproximada, probabilidades relativas à média amostrai 
X n , desde que n seja suficientemente grande. 


EXEMPLO 6.2: Simulando o efeito do TCL 

Para ilustrar o funcionamento do Teorema Central do Limite, vamos exibir agora 
um exemplo em que a distribuição original a partir da qual os dados são gerados é uma 
exponencial, modelo este que dá origem a uma função densidade bastante assimétrica 
(ao contrário do que ocorre com a curva Normal). 

Como já vimos anteriormente, a densidade de uma exponencial com parâmetro X é 
dada pela expressão 


f(x) = 


Áe' Xx , 

10 , 


se x > 0 
se x< 0 


e neste caso temos E(X) = DP(X) = 1/Á. 


Gerando dados por simulação a partir de uma exponencial com X = 1/3, para cada 
um dos seguintes tamanhos n de amostra: 1, 2, 3, 4, 5, 10, 15 e 20: 

1. Obtivemos 200 valores da média amostrai X . 

n 

2. Utilizamos esses 200 valores para construir um histograma. 

3. Traçamos no mesmo gráfico uma curva da densidade Normal com E(X ) = 3e 
DP(X n )=3/Vn. 

Os oito histogramas obtidos estão na Figura 6.4. Eles nos mostram que, à medida 
que o tamanho n da amostra cresce, a forma do histograma se aproxima cada vez mais 
de uma curva Normal. 
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Uma pergunta natural neste ponto seria: “Quão grande deve ser n para que possamos 
usar a aproximação fornecida pelo TCL com um nível de precisão aceitável?” 
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FIGURA 6.4 Histogramas de X n para vários valores de n 
Dados gerados a partir de uma exponencial. 


Evidentemente, a rapidez com que essa convergência se dá depende de quão distante está 
a forma da distribuição original das X j s de uma curva Normal. Em outras palavras, se a distri¬ 
buição das X, já não for muito diferente de uma Normal, com um n não muito grande con¬ 
segue-se uma boa aproximação. Caso contrário, somente para n bem grande (usualmente, 
n > 30) a aproximação da distribuição de X n por uma Normal funcionaria adequadamente. 

No exemplo a seguir vamos apresentar esse fenômeno, a saber, a convergência da 
distribuição de X n para uma Normal à medida que n cresce, gerando por simulação os 
dados originais a partir de diferentes modelos probabilísticos. Em todos os casos, a dis¬ 
tribuição original é bem diferente da Normal, E(X) = 3 e DP(X) = 3. No que se refere à 
simulação, foi seguida a mesma sequência de passos do exemplo anterior (distribuição 
Exponencial). Os gráficos relativos a um mesmo modelo estão agrupados. 


EXEMPLO 6.3: Mostrando, através de simulações, que a rapidez da 
convergência do TCL depende da forma da distribuição original 


A) Uniforme(a = 3 - 3 V3, b = 3 + 3 V3) E(X) = 3, 
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FIGURA 6.5 Histogramas de X n para vários valores de n 
Dados gerados a partir de uma Uniforme. 
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B) Combinação de duas normais: N(1; I) com N(8; I) 
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FIGURA 6.6 Histogramas de X n para vários valores de n 
Dados gerados a partir de uma mistura de normais. 


C) Um vale central 
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FIGURA 6.7 Histogramas de X n para vários valores de n 
Distribuição original com um vale central. 


Como se pode observar: 

• No caso da distribuição uniforme (A), o histograma de X n já se aproxima bastante 
de uma Normal quando n é da ordem de 4. 

• Já nos casos da mistura de Normais (B) e da figura em que há um vale no centro da 
distribuição (C), modelos esses que se afastam muito mais de um “comportamen¬ 
to gaussiano”, a aproximação pela Normal só se mostra mais adequada a partir de 
n em torno de 10. 

• No caso do modelo em (C), à medida que n cresce, tudo se passa como se houvesse 

a “erupção de um vulcão dentro do vale”. ■ 


Observação: 

Quando começamos a introduzir o modelo Normal na Subseção 4.5.1, chamamos a 
atenção do leitor para o fato de que em alguns exemplos ali apresentados os gráficos das 
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funções de probabilidade dos modelos Binomial (Figura 4.4) e de Poisson (Figura 4.5) 
já sugeriam o tal “comportamento gaussiano”. Agora talvez fique mais fácil encontrar¬ 
mos uma explicação para tal “coincidência”. Para isso, lembre-se também de que uma 
Binomial é uma soma de BernoullPs independentes e de que a soma de Poisson’s inde¬ 
pendentes é também Poisson (conforme foi visto no Exercício Resolvido 5.1_R). 


EXEMPLO 6.4: Voluntários se quotizam para realizar uma obra 

Consideremos então aquela instituição de caridade citada na abertura do capítulo. 
Ela deseja realizar uma obra que custa R$3.500,00. Sabe-se também que, entre os con¬ 
tribuintes habituais dessa instituição, a quantia de que cada um pode dispor obedece a 
uma mesma distribuição de probabilidade com média R$120,00 e desvio-padrão 
R$50,00. Se 30 desses voluntários se quotizarem com essa finalidade, qual a probabili¬ 
dade de que eles consigam o montante necessário? 


Solução: 

Seja Xj a quantia disponível da pessoa i, i = 1, 2, ..., 30. 
Queremos calcular P[ (X, + X 2 + ... +X 30 ) > 3500 1, ou seja, P 


Jx, >3500 


_i=l 


Dividindo os dois membros da desigualdade por 30, temos 




r- 3500] 

2^X j >3500 

_i=l 

= p 

X 30 — - 

30 


Admitamos que: 

• os 30 voluntários podem ser vistos como uma amostra aleatória extraída de um 
conjunto maior; 

• n = 30 já é suficientemente grande para que se possa usar a aproximação dada pelo 
Teorema Central do Limite. 


Sabemos que a distribuição de X 30 se aproxima de uma Normal com média 120 e 
desvio-padrão igual a 50/V3Õ. Então, 


pi2>, 


> 3500] = P 


ív .35001 

- P 

~X 30 - 120 ^ 3500/30-120" 

L 30 ~ 30 J 


50/V3Õ ~~ 50/730 


= P|Z > -0,365] = 0,64 , onde esta última probabilidade foi determinada a partir da dis- 
tribuição Normal padronizada, recorrendo a um software adequado (ou tabela). 

Isso significa que a chance de a obra ser realizada com base nesses 30 donativos seria 
de aproximadamente 64%. ■ 


Exercitando: 

O cálculo das probabilidades no Exemplo 4.14, que trata do número de consultas à 
homc payc de uma empresa, Lambem pode ser leito com o auxílio do Teorema Central 
do Limite, lente íazê lo e veja se você obtem os valores ali apresentados. 
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6.2 APROXIMAÇÃO DA BINOMIAL PELA NORMAL 

Se X é uma variável aleatória com distribuição Binomial de parâmetros n e p então, 
como já foi visto anteriormente, X é uma soma de n Bernoullfs iid Y,,...,Y n , todas com 

parâmetro p, ou seja X = ^ Y,. Portanto, 

t=i 


2 >, 


Z = 


n 


íp(l-p) 


n 


X-np 

Vnp(l-p) 


Pelo Teorema Central do Limite, essa v.a. Z tem distribuição aproximadamente Nor¬ 
mal padronizada, se n for suficientemente grande. 

Caso se deseje calcular P[a < X < b], onde a e b são números inteiros, como se trata 
de aproximar uma distribuição discreta (Binomial) por uma contínua (Normal), con¬ 
vém introduzir, antes de mais nada, uma correção: subtrair 1/2 de a e somar 1/2 a b. 
Temos então 


P[a < X < b] = P 


a--<X< b+- 
2 2 


Padronizando: 


P[a < X < b] =cp 


b + 1/2 - np ^ 

-O 

a - 1/2 - np ^ 

1 V n pd-p) J 


1 V n pd-p) J 


Por que é importante fazer a correção indicada? 

Para melhor entender esse ponto, suponhamos, por exemplo, que 
X - binomial (30; 0,4) - (Ver figura a seguir) e que o nosso objetivo seja calcular 

P[ 10 < X < 151 = P[X = 10] + P[X = 11] + P[X = 12] + 

+ P[X= 13] + P[X= 14] + P[X= 15] 

Aqui temos média = np = 30 x 0,4 = 12 e variância = np( 1—p) = 30 x 0,4 x 0,6 = 7,2. 

Sabemos que a distribuição de X é Binomial (30; 0,4) e ela pode ser aproximada por 
uma Normal (12, 7,2). Então P[X = 10] é aproximadamente igual à área sob a curva 
Normal e entre 9,5 e 10,5, como mostra a figura a seguir. Ou seja, 

p 10 = P[X = 10] s P[9,5 < X < 10,51. 

Analogamente, P[10,5 < X < 11,5] s p n , P[14,5 < X < 15,5] = p 15 . 

Como a curva Normal mostrada na figura se ajusta muito bem à função de probabili¬ 
dade da Binomial, concluímos que 

Pio + Pn + Pi2 + P 1 3 + Pi 4 + P 15 = P[9,5 < X < 15,5] 

Está então explicada a necessidade de se subtrair 1/2 do limite inferior do intervalo e 
somar 1/2 ao seu limite superior antes de efetuar a padronização. 
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FIGURA 6.8 A importância da correção ao se aproximar Binomial por Normal. 

A aproximação da Binomial pela Normal é um recurso muito usado em Estatística, 
uma vez que, quando a amostra é grande, fazer esses cálculos com o uso da própria fór¬ 
mula da Binomial seria em geral excessivamente trabalhoso. Uma aplicação importante 
dessa aproximação ao desenvolvimento teórico da Inferência Estatística é o teste de hi¬ 
póteses sobre proporções, (ver Seção 8.7) 

Convém realçar também o fato de que a aproximação da Binomial por uma Normal 
funciona tanto melhor quanto mais o p da Binomial se aproxima de 1/2. Isso quer dizer 
que quando p é muito pequeno (próximo de 0) ou muito grande (próximo de 1), o nú¬ 
mero n de replicações teria de ser de fato muito grande para que essa aproximação fosse 
suficientemente precisa. Assim, à guisa de regra prática, recomenda-se usar a aproxi¬ 
mação da Binomial por uma Normal somente quando np(l - p) > 3. 

EXEMPLO 6.5: Lojas que aceitam compra no cartão 

Pedro pretende fazer suas compras de Natal de modo a presentear 40 pessoas entre 
parentes e amigos. Como ele dispõe de relativamente pouco dinheiro em espécie na car¬ 
teira e está sem o talão de cheques, sua intenção é fazer tantas compras quanto puder 
usando o cartão de crédito. Acontece que ele está em uma cidade pequena, onde apenas 
30% das lojas aceitam compras no cartão. Além disso, as lojas dessa cidade são todas 
muito especializadas, e os gostos dos parentes e amigos de Pedro são muito variados. 
J .ogo ele terá de fazer cada compra em uma loja diferente. Qual a probabilidade de que 
ele consiga fazer pelo menos 40% das suas compras usando o cartão? 


Solução: 


Seja X o número das lojas onde ele poderá usar o cartão entre as 40 escolhidas. Então 
X ( Binomial c om n = 40 e p = 0,3. Queremos calcular 
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Ora, é claramente muito trabalhoso lazer o cálculo por essa (órmula Vejam» "Uo 
como ficaria a aproximação da Binomial pela Normal: 


P[X> 16] = P[X> 15,5] 


= P 


15,5-40x0,3 
^40 x 0,3 x 0,7 


P[Z> 1,211 =0,1 13 


Concluímos então que a probabilidade de Pedro conseguir fazer pelo menos 40% das 
suas compras usando o cartão de crédito é de apenas 0,113, aproximadamente. 


O exemplo a seguir é particularmente interessante porque, dada a relativa simplici¬ 
dade dos cálculos, neste caso podemos usar tanto o próprio modelo Binomial como o 
modelo Normal e então comparar os resultados obtidos para ver quão precisa é a apro¬ 
ximação. 


EXEMPLO 6.6: Viagem de avião - quem faz reserva, sempre consegue viajar? 

Um avião tem m = 48 lugares. Sabendo que, em média, 10% das pessoas que fazem 
reserva não comparecem na hora do vôo, a companhia aérea decide aceitar n = 50 reser¬ 
vas. Qual a probabilidade de que todas as pessoas que comparecem na hora do vôo con¬ 
sigam de fato viajar? 

Solução: 

O número de pessoas X que comparecem obedece a uma distribuição Binomial com 
parâmetros n = 50 e p = 0,9. Para que todas as que comparecem possam viajar, é neces¬ 
sário que X < m = 48. 

Então a probabilidade desejada é 


P[X < 48] = 1 - (P[X = 49] + P[X = 50]) = 1 - (50 x 0,9 49 x 0,1 + 0,9 50 ) = 0,966 

Entretanto essa probabilidade também pode ser calculada aproximando a Binomial 
por uma Normal (e admitindo, é claro, que n = 50 já é suficientemente grande para que 
se possa usar a aproximação dada pelo Teorema Central do Limite). 


P[ X < 48} = P[ X < 48 + Vi 


48,5 - 50 x 0,9 
^50 x 0,9 x 0,1 


= P[Z< 1,65] = 0,95 


Exercitando: Considerando a segunda situação descrita no início deste capítulo, su¬ 
ponha que a construtora Casa Moderna decidiu entrar no programa com 50.000 casas. 
Com base na argumentação ali apresentada, calcule a probabilidade de que pelo menos 
40.000 entre os compradores pudessem pagar todas as suas prestações. 

6.3 AMOSTRAGEM ALEATÓRIA SIMPLES 

Se vamos trabalhar por amostragem, como devemos selecionar os elementos da amos¬ 
tra de modo a poder garantir representatividade com relação à população de interesse; 
tanto em termos do seu tamanho quanto em termos do seu perfil? 
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Existem essencialmente dois tipos de amostragem: a amostragem probabilística e a 
amostragem não-probabilística. Na primeira, todos os elementos da população têm 
uma probabilidade conhecida (diferente de zero) de pertencer à amostra; enquanto na 
segunda, essas probabilidades são desconhecidas. Do ponto de vista da teoria, a amos¬ 
tragem probabilística é a única que pode ser considerada, pois só ela nos permite dedu¬ 
zir os procedimentos da Inferência Estatística. Através de tais procedimentos, podemos 
extrair conclusões sobre a população a partir da amostra e, ao mesmo tempo, quantifi¬ 
car as probabilidades de erro envolvidas nesse processo. 

A Amostragem Intencional funciona? 

Há quem defenda a idéia de que, em um levantamento amostrai, a seleção dos elemen¬ 
tos que irão compor a amostra não deve ser feita aleatoriamente, e sim segundo um cri¬ 
tério subjetivo estabelecido pelo próprio pesquisador. É a chamada Amostragem 
Intencional. Que vantagens e que desvantagens você vê nessa forma de trabalhar? 


A técnica mais simples de amostragem probabilística é a chamada amostragem 
aleatória simples (AAS), em que cada possível amostra de tamanho n tem igual 
probabilidade de ser escolhida. 


A realização desse tipo de amostragem exige que a população seja finita, de tamanho 
N conhecido e acessível. 

Quando dizemos que foi extraída uma amostra aleatória com n elementos a partir de 
uma população composta por N elementos, o que isso significa? 

O leigo tende a interpretar o termo “aleatório” como sinônimo de “de qualquer jeito” 
ou “sem nenhum critério”. Mas, em Estatística, essa não é a interpretação correta do 
termo “aleatório” ou “ao acaso”. 

Se o processo de extração da amostra é aleatório, isso quer dizer que há uma regulari¬ 
dade importante a ser respeitada: todos os elementos da população têm a mesma proba¬ 
bilidade de virem a ser selecionados para fazer parte da amostra. 


EXEMPLO 6.7: Selecionando uma amostra aleatória simples 

Para exemplificar a seleção de uma AAS, vamos supor que a nossa população seja 
formada pelo conjunto dos oito primeiros números naturais {1,2,3,4,5,6,7,81. Quantas 
são as diferentes amostras com três elementos que podem ser extraídas dessa popula¬ 
ção? A resposta a essa pergunta vem da Análise Combinatória (ver Anexo 1) e é 

= 56 amostras de tamanho 3. 
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356 357 358 367 368 378 456 457 

458 467 468 478 567 568 578 678 

Cada uma dessas amostras tem probabilidade igual a 1/56 de ser selecionada. 

No Exercício Resolvido 6.l_Ré descrito com detalhes o cálculo dessa probabilidade, 
usando a noção de distribuição de probabilidade condicional relativa a várias variáveis 
aleatórias, que foi vista no Capítulo 5. ^ 

Esclarecimento 

Em geral, o termo amostragem aleatória simples se refere à amostragem sem reposi¬ 
ção. Então, se um indivíduo da população é escolhido para fazer parte da amostra, ele 
não é devolvido à população antes da extração dos subsequentes. 

Entretanto, é também conveniente considerarmos a amostragem com reposição, em 
que cada indivíduo escolhido é devolvido à população antes de realizarmos a próxima ex¬ 
tração. A principal importância desse tipo de amostragem é teórica, já que nesse esquema 
os indivíduos são selecionados de forma independente, e todos têm a mesma probabilida¬ 
de de serem escolhidos. Assim, ao trabalharmos dessa forma, cada indivíduo pode apare¬ 
cer na amostra quantas vezes for necessário. Isso quer dizer que podemos raciocinar 
como se uma amostra obtida com reposição fosse proveniente de uma população infinita. 

A rigor, os resultados que veremos a seguir são baseados na amostragem aleatória de 
uma população infinita. Porém, se ela for finita, desde que o tamanho N dessa popula¬ 
ção seja muito maior que o tamanho n da amostra, podemos considerar a amostragem 
sem reposição como aproximadamente equivalente a uma amostragem com reposição 
e, sendo assim, valem para ela os resultados aplicáveis às populações infinitas. 

6.4 AMOSTRAL VERSUS POPULACIONAL 

Vimos que vários dos conceitos que já haviam sido introduzidos no Capítulo 1, sobre 
Análise Exploratória, reapareceram dentro do Cálculo de Probabilidades, com uma de¬ 
finição diferente. Estamos falando de conceitos tais como média, desvio-padrão, etc. 

Porém, é importante que o leitor faça uma distinção clara entre o conceito de média 
p = E(X) de uma variável aleatória X (no sentido probabilístico), apresentado no Capí¬ 
tulo 4, e o conceito de média x, visto no Capítulo 1. 

Um exemplo talvez nos ajude a esclarecer melhor essa diferença. 

Consideremos a população formada por todos os empregados de uma grande em¬ 
presa. A variável de interesse neste exemplo será o salário do empregado. 

Quando estivermos falando sobre a média da variável aleatória salário, estaremos 
nos referindo à média dos salários de todos os empregados da empresa. Essa média p é, 
portanto, um número fixo, que é uma característica dessa população. Trata-se de uma 
média populacional. 

Suponhamos, porém, que tenha sido extraída uma amostra aleatória composta de 
digamos, 300 empregados dessa empresa. A média aritmética x dos salários dos empre¬ 
gados que fazem parte dessa amostra é o conceito que foi visto no Capítulo 1. Trata-se 
de uma característica dessa particular amostra. Se fosse extraída uma outra amostra 
aleatória também com 300 empregados, a nova média de salários provavelmente teria 
outro valor. Estamos falando, portanto, de uma média amostrai. 


AMOSTRAGEM: UMA PONTE ENTRE PROBABILIDADE E INFERÊNCIA 167 

ELSEVTER 

Enquanto a média populacional p é uma constante, a média amostrai x é mais um 
exemplo do que chamamos de variável aleatória, conforme foi visto anteriormente nes¬ 
te capítulo. 

E claro que se espera que o valor da média amostrai esteja próximo do valor da média 
populacional, porém, é importante entender que se trata de conceitos distintos. Dize¬ 
mos que a média amostrai x é uma estimativa da média populacional p. Voltaremos a 
essa discussão no Capítulo 7. 

Da mesma forma, existe uma distinção entre desvio-padrão populacional e des¬ 
vio-padrão amostrai, etc. 

6.5 A ABORDAGEM DOS PROBLEMAS REAIS ATRAVÉS DA 
INFERÊNCIA ESTATÍSTICA 

Qual o caminho para se obter conclusões sobre a população a partir da análise dos 
dados de uma amostra? 

Quando estamos tentando obter respostas para perguntas acerca de um dado fe¬ 
nômeno através da abordagem estatística, o ponto de partida costuma ser o conheci¬ 
mento que conseguimos obter sobre o tema de interesse. Isso nos leva inicialmente a 
elaborar um modelo probabilístico teórico que procura representar em linguagem 
matemática o comportamento daquele fenômeno. Ocorre que, em geral, nesse mo¬ 
delo probabilístico aparecem algumas grandezas (parâmetros) cujo valor a priori 
desconhecemos. 

Nesse momento ocorre a etapa em que, através de um processo de amostragem, são 
coletados dados reais sobre o assunto em questão, que irão alimentar o nosso modelo, 
permitindo assim que utilizemos as técnicas da Inferência Estatística. Assim a incerteza 
inicial sobre o valor dos parâmetros em jogo é substancialmente reduzida. 

Essa seqüência de passos, que pretende nos fornecer as respostas para as nossas in¬ 
dagações, está representada na figura a seguir: 




FIGURA 6.9 As etapas típicas do tratamento estatístico de um problema real. 
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Nos Capítulos 1 e 2, foram estudados métodos exploratórios para sr analisar um 
conjunto de dados, que pode ser uma população ou uma amostra. Agora checou o mo 
mento de apresentarmos os chamados métodos confirmatórios, através dos quais po 
deremos expandir com segurança as conclusões obtidas a partir da amostra para toda a 
população. Essa expansão, que chamamos de Inferência Estatística, é o assunto a ser es¬ 
tudado nos Capítulos 7 e 8. 

Grandes Temas da —Estimação de Parâmetros 

< 

Inferência Estatística -Testes de Hipótese 


RESUMO DO CAPÍTULO 6 

• Se um mesmo experimento pode ser repetido n vezes sempre sob as mesmas 
condições, temos n variáveis aleatórias iid X,, X 2 ,..., X n e dizemos então que elas 
formam uma amostra aleatória do fenômeno que estamos estudando. 

• Suponha que cada uma das X, (i= l,2,...,n) tem média pe variância a 2 . O Teore¬ 
ma Central do Limite (TCL) afirma que, independentemente de qual seja a dis¬ 
tribuição original dos X^s, a distribuição de probabilidade da média aritmética 
X n da amostra aleatória e a distribuição Normal(p; a 2 /n) se aproximam cada 
vez mais uma da outra, à medida que o tamanho n da amostra cresce. 

• Aproximação da Binomial pela Normal: Se X é uma variável aleatória com dis¬ 
tribuição Binomial com parâmetros n e p, então a distribuição da variável 

—==^E= é aproximadamente uma Normal padrão, se n for suficientemente 

Vnp(l-p) 

grande. 

• A técnica mais simples de amostragem é a chamada amostragem aleatória sim¬ 
ples (AAS), segundo a qual cada possível amostra de tamanho n tem igual pro¬ 
babilidade de ser escolhida. 

• Através da Inferência Estatística, podemos extrair conclusões sobre a popula¬ 
ção de interesse por meio de um procedimento de amostragem e, ao mesmo 
tempo, quantificar as probabilidades de erro envolvidas nesse processo de ex¬ 
trapolação da parte para o todo. 


EXERCÍCIOS RESOLVIDOS 

6.I_R) Quantificando a probabilidade de seleção de uma amostra 

No Exemplo 6.7 vimos que o número total de amostras possíveis de tamanho 3 da po¬ 
pulação formada pelo conjunto dos oito primeiros números naturais 11,2,3,4,5,6,7,8} é 
56. Como podemos usar a noção de distribuição de probabilidade condicional envolven¬ 
do várias variáveis aleatórias para mostrar que cada uma dessas amostras tem a mesma 
probabilidade 1/56 de ser extraída? 
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Solução: 

Na AAS os elementos são selecionados sem reposição. Portanto, já que em cada sor¬ 
teio todos os elementos têm a mesma chance de serem selecionados, podemos racioci¬ 
nar como se segue. 

Para uma população de tamanho 8 e uma amostra de tamanho 3, seja X, o primeiro 
elemento a ser sorteado. Então X, é uma variável aleatória e 

P[X, = i,] = —, para todo i, = 1,2,...,8. 

8 

Seja X 2 o segundo elemento a ser sorteado. Então X 2 é também uma variável aleatória e 

P[X 2 = i 2 |X, = i,] = —, para todo i 2 * i,. 

Seja X 3 o terceiro elemento a ser sorteado. X 3 é também uma variável aleatória e 

P[X 3 = i 3 |X[ = i l5 X 2 = i 2 ] = —, se i 3 ^ i] e i 3 ^ i 2 . 

6 

A partir da distribuição conjunta das variáveis aleatórias X,, X 2 e X 3 , vamos mostrar 
que a probabilidade de a amostra sorteada ser um particular subconjunto com três ele¬ 
mentos é necessariamente igual a —, conforme afirmamos anteriormente. 

56 

Tomemos uma possível amostra com três elementos, digamos, A ={2,5,7}. 

A probabilidade de que essa seja a amostra selecionada é igual a 

£p |x, =i,,X, =i 2 ,X, =i,l 

i , ,i 2 ,Í]CA 

Uma das possibilidades contempladas nesse somatório seria i, = 2, i 2 = 5 e i 3 = 7. Cal¬ 
culemos a probabilidade associada a ela. Usando a regra do produto (ver Seção 3.4): 

P[X, = 2, X 2 = 5,X 3 = 71 =P[X 1 = 2] P[X 2 = 5|X, = 2] P[X 3 = 7|X, = 2,X 2 = 5] =-x-x- 

8 7 6 

Por outro lado, quantas são as triplas (i b i 2 , i 3 ) no conjunto A? São todas as permuta¬ 
ções possíveis dos elementos 2,5,7. Logo são 3! = 6 permutações: 

257 275 527 572 725 752 

É claro que a probabilidade de ocorrência de cada uma delas é também igual a 

1 1 1 

— x — x —. 

8 7 6 

Concluímos então que a probabilidade de ser sorteada exatamente a amostra 

A = {2,5,7} é realmente6x — x - x - = —. 

8 7 6 56 

Lvideniemente, isso vale lambem para qualquer outra amostra de tamanho 3. 
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6.2_R) Hospedagem de congressistas em hotéis 

O comitê organizador de um congresso científico contratou cinco hotéis da cidade 
onde vai se realizar esse evento para hospedarem os 1.000 congressistas inscritos. Cada 
um desses hotéis só têm quartos individuais e só poderá hospedar os participantes do 
congresso durante esse período. Admita que cada congressista escolherá de íorma alea¬ 
tória para qual dos cinco hotéis ele vai se dirigir. O Hotel X é um desses cinco hotéis e 
tem capacidade para acomodar 210 pessoas. 

a) Qual a probabilidade de que o Hotel X consiga acomodar todos os congressistas 
que o procurarem? 

b) Qual a probabilidade de que pelo menos n = 90% do total de quartos do Hotel X 
sejam ocupados? 

c) Para que no Hotel Y (outro dos cinco): 

• a probabilidade de que ele consiga acomodar todos os congressistas que o pro¬ 
curarem seja 0,95; 

e 

• a probabilidade de pelo menos n% do seu total de quartos serem ocupados 
seja 0,99; 

qual deve ser o valor de 7t e qual deve ser a capacidade total desse hotel? 


Solução: 

Seja X (resp. Y) o número de congressistas que se dirigem para o Hotel X (resp. Y). 
Então X e Y têm ambas distribuição binomial com n = 1000 e p = 1/5 = 0,2, que pode ser 
aproximada por uma Normal (1.000 x 0,2; 1000 x 0,2 x 0,8). 


a) 


P(X < 210) = P 


Z< 


210,5-1000x0,2 
VlOOO x 0,2 x 0,8 


= P(Z < 0,83) = 0,797 ou 79,7%. 


Logo, a probabilidade de que o Hotel X consiga acomodar todos os congressistas 
que o procurarem é 79,7%. 


b) 


P(X>0,9x210) = P 


Z> 


188,5-1000x0,2 
V1000x0,2x0,8 


= P(Z>-0,91) = 0,818 ou 81,8%. 


Logo, a probabilidade de que pelo menos 90% das acomodações do Hotel X se¬ 
jam preenchidas com os congressistas é 81,8%. 


c) Seja C a capacidade do hotel Y. Sabemos que: 


P(Y< C) = 0,95 (I) e 


Y > 


TtC N 

1ÕÕ, 


= 0,99 (II) 


Então, padronizando I, temos: 


V 













ELSEVIER 


AMOSTRAGEM: UMA PONTE ENTRE PROBABILIDADE E INFERÊNCIA 


171 


z< 


C + 0,5 -1000x0,2" 
V1000x0,2x0,8 , 


= 0,95, o que implica que 


C-199,5 
V 1000x0,2x0,8 


1,645 


Logo, C = 199,5 + 1,645 x 12,649 = 220 hóspedes. 
Por outro lado, padronizando II, temos: 


P 


f 

Z > 


>2071 3 

—— - 0,5 - 1000 x 0,2 

100 


VlOOO x 0,2 x 0,8 


V 


2 


0,99, o que implica que 


_ 200,5 

100 _ 

VlOOO x 0,2 x 0,8 


-2,326 


Logo, operando algebricamente, chegamos a n =77,76%. 

Então, para que o Hotel Y, ao mesmo tempo: 

• acomode todos os congressistas que o procurarem com probabilidade 95%; e 

• tenha n% das suas acomodações preenchidas com probabilidade 99%; 

é preciso que: 

1) Capacidade do Hotel Y = 220 hóspedes 

2) percentual tt = 77,76% 


6.3_R) Pesquisas eleitorais conflitantes 

Dois Institutos de Pesquisa de Opinião, IP1 e IP2, realizaram na mesma data pesqui¬ 
sas por amostragem sobre as intenções de voto dos eleitores em uma eleição em que há 
apenas dois candidatos, envolvendo um eleitorado de 10 milhões de pessoas. Cada um 
dos Institutos de Pesquisa ouviu 2.000 pessoas. Os resultados apontados por esses ins¬ 
titutos são: 

IP 1: Candidato A 54% 

Candidato B 46% 

IP2: Candidato A 46% 

Candidato B 54% 

A margem de erro anunciada por ambos os Institutos foi de 2 pontos percentuais, 
para mais ou para menos. 

Suponha que, quando questionado sobre o assunto, um analista atribuiu o ocorrido 
ao acaso, ou seja, a aleatoriedade que caracteriza o processo de seleção amostrai. Co¬ 
mente a explicação desse analista. 
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Obs.: Você pode supor, para lacilitar o seu raciocínio, que ambos os insiimios li/.< 
ram uma amostragem aleatória simples do eleitorado. Essa suposição é apenas uma 
simplificação da realidade, já que, na prática, os institutos de pesquisa costumam r.ar 
esquemas de amostragem bem mais sofisticados. 

Sugestão: Se p é a proporção real de intenção de votos para A no eleitorado, 
p, é a proporção de intenção de votos para A estimada por IP1, 
p,é a proporção de intenção de votos para A estimada por IP2; 
verifique como a expressão 

P[0,54 - 0,02 < p, < 0,54 + 0,02;0,46 - 0,02 < p 2 < 0,46 + 0,02] depende de p. 

Solução: 

Devido à independência, 

P[0,54 - 0,02 < p, < 0,54 + 0,02; 0,46 - 0,02 < p 2 < 0,46 + 0,02] = 

= P[0,52 < $,<0,56] . P[0.44 < p 2 < 0,48] = 


0,52-p ^ 0,56 - p 


fp(l-p) 

2000 


íp(l-p) 


2000 


0,44 - p 

f põ^p) 

V 2000 


<z< 


0,48 - p 

I p(l-P) 
V 2000 


= ProblxProb2 


Para cada p, de 0,1 em 0,1, desde p = 0,1 até p = 0,9, podemos calcular Probl, Prob2 e 
o produto dessas duas probabilidades: 


p 

0,1 

0,2 

0,3 

0,4 

0,5 

0,6 

0,7 

0,8 

0,9 

Probl 

0 

0 

0 

0 

3,682x IO- 2 

1,304 x lO^ 1 

0 

0 

0 

Prob2 

0 

0 

0 

1,304 x 1 o - 4 

3,682x| O" 2 

0 

0 

0 

0 

produto 

0 

0 

0 

0 

l.356x IO’ 3 

0 

0 

0 

0 


Obs.: Cálculos aproximados. 


Os resultados mostram que, independente de qual seja o valor de p, esse produto é 
sempre um número muito pequeno, o que significa que é altamente improvável que 
dois institutos gerem estimativas assim tão díspares entre si apenas por acaso. 

EXERCÍCIOS PROPOSTOS 

6.I_P) Pesquisa de mercado 

Uma empresa estuda a possibilidade de lançar no mercado um novo detergente, 
por um preço um pouco mais alto do que o dos produtos similares, mas supostamente 
de qualidade muito superior. Para isso ela encomendou uma pesquisa de mercado na 
qual 200 consumidores escolhidos aleatoriamente serão ouvidos sobre sua intenção 
de adquirir o novo produto. A empresa só pretende lançá-lo de fato no mercado se 
pelo menos 40 entre os consumidores consultados responderem favoravelmente. 
Seja p a verdadeira proporção populacional dos consumidores dispostos a usar o 
novo produto. 
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a) Calcule a probabilidade de que o lançamento ocorrerá, se p = 0,15. 

b) Idem, se p = 0,25. 

Sugestão: Aproximar Binomial por Normal. 

6.2_P) Será que a receita líquida do taxista compensa? 

Um taxista costuma arrecadar, por dia de trabalho, um valor cuja média é de 150 reais e 
cujo desvio-padrão é de 100 reais. Esse valor corresponde à soma do que ele recebe em to¬ 
das as corridas daquele dia, já descontados os seus gastos com combustível. Tanto a licença 
(a chamada autonomia) como o carro que ele usa pertencem a uma outra pessoa, que arca 
com todas as demais despesas necessárias a essa atividade (manutenção do veículo, licencia¬ 
mento etc.). Essa pessoa cobra do taxista uma quantia fixa de 2.500 reais por mês, pelo uso 
do carro e da licença. Se o taxista roda durante 25 dias por mês, qual a probabilidade de que 
em um certo mês ele terá uma receita líquida de pelo menos 1.500 reais? 

6.3_P) E rros de arredondamento em uma soma de 50 números 

Cinquenta números, que originalmente tinham várias casas decimais, depois de arre¬ 
dondados, passaram a ter apenas duas casas decimais. Admita que os erros individuais de 
arredondamento são independentes e podem ser modelados como uniformes no interva¬ 
lo (-0,005;+0,005). 

a) Qual a probabilidade de que a distância (módulo da diferença) entre a soma dos 
números já arredondados e a soma dos números originais seja maior que 0,03? 

b) Qual o valor de c para que essa distância seja maior que c com apenas 1% de pro¬ 
babilidade? 

6.4_P) Distribuição de verbas para o Ensino Básico 

O governo de um certo estado do Brasil decidiu adotar um critério para a distribui¬ 
ção de verbas ligadas à área de Ensino Básico entre os municípios daquele estado. Em 
cada município são sorteadas 25 escolas de Ensino Fundamental para serem inspecio¬ 
nadas com relação a diversos aspectos que procuram medir a qualidade da sua adminis¬ 
tração (bom uso dos recursos disponíveis, assiduidade e pontualidade dos professores, 
nível do ensino etc.): 

• Se o número de escolas consideradas aprovadas nessa inspeção for pelo menos 
igual a 20, o município recebe uma dotação alta. 

• Se o número de escolas consideradas aprovadas nessa inspeção estiver entre 14 e 
19 (incluindo os extremos do intervalo), o município recebe uma dotação média. 

• Se o número de escolas consideradas aprovadas nessa inspeção for no máximo 
igual a 13, o município recebe uma dotação baixa. 

Qual a probabilidade de que um município onde 65% das escolas são bem administradas: 

a) receba uma dotação alia? 
bj receba uma dotação média? 

c) receba uma dotação baixa? 

Sugestão: Use a aproximação da binomial pela Normal. 
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6.5_P) Síndrome do pânico 

Sabe-se que 25% dos pacientes de um grande hospital psiquiátrico sofrem de síndro¬ 
me do pânico. Foram sorteados n = 60 pacientes desse hospital como um todo para par¬ 
ticipar de uma pesquisa envolvendo diversos temas relativos à Psiquiatria. Uma parte 
importante dessa pesquisa se refere a questões ligadas à síndrome do pânico. Qual a 
probabilidade de que pelo menos 20 entre os participantes dessa pesquisa sofram de 
síndrome do pânico? 

6.6_P) Suspeita de diabetes 

O conteúdo de glicose no sangue de pessoas adultas pode ser considerado normal¬ 
mente distribuído com média 100 mg/100 ml e desvio-padrão 10 mg/100 ml. Admita 
que indivíduos com um conteúdo de glicose de pelo menos 120 mg/100 ml são conside¬ 
rados suspeitos de serem diabéticos. Qual a probabilidade de que em uma amostra 
composta de 500 indivíduos sorteados ao acaso a partir de uma população de pessoas 
adultas haja pelo menos 15 suspeitas de ter essa doença? 


CAPÍTULO 7 


ESTIMAÇÃO 
DE PARÂMETROS 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Estimador pontual 

• Viés de um estimador, estimador não tendencioso 

• Erro quadrático médio 

• Conceito amostrai x conceito populacional 

• Erro absoluto e erro relativo de uma estimativa pontual 

• Distribuição t de student 

• Intervalo de confiança 


Seu Fernando está analisando a possibilidade de se candidatar a prefeito em sua cidade. Ele 
acha que é suficientemente popular, mas não sabe como quantificar essa popularidade. Seu Fer¬ 
nando gostaria de conhecer suas chances numa futura eleição e, com esse objetivo, consulta um 
estatístico para se informar melhor sobre pesquisas eleitorais. 0 estatístico lhe informa que é im¬ 
possível, a partir de uma amostra dos eleitores, prever com exatidão o resultado da eleição. 0 
que pode ser feito, lhe diz o estatístico, é tentar minimizar o erro envolvido nessa estimativa. Con¬ 
tudo, ele esclarece, para que o erro de estimação diminua, o tamanho da amostra tem de au¬ 
mentar e, consequentemente, o custo da pesquisa também aumentará. Além disso, diz o 
estatístico, é preciso indicar o grau de confiança no resultado obtido, já que sempre há uma pro¬ 
babilidade de o erro acabar sendo maior do que esperávamos que ele fosse, mas podemos fazer 
com que essa probabilidade seja bem pequena. 

Assim, Seu Fernando compreende que realizar uma pesquisa eleitoral não é um assunto sim¬ 
ples e que, sem o auxílio da Estatística, seria difícil tanto avaliar o seu custo, quanto determinar o 
erro da estimativa. 

Uma vez terminada essa conversa, ele já se sente bem mais informado sobre o que se pode 
esperar de uma pesquisa eleitoral. Nesse momento, seus questionamentos são os seguintes: 
Qual a margem de erro tolerável para a estimativa do verdadeiro número de eleitores favoráveis 
a sua candidatura no dia da votação? Será que os recursos de que ele dispõe para a pesquisa são 
compatíveis corri um nível de precisão aceitável? Qual o grau de confiança que ele pode ter no re¬ 
sultado obtido? 
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Aqui estão algumas das questões que poderão ser respondidas usando os conceitos e as ter 
nicas do presente capitulo: 

• Como estimar por amostragem a porcentagem de eleitores de Seu Fernando? 

• Qual seria o número de eleitores necessários para compor a amostra, de modo a 
que o erro de estimação tenha uma magnitude prefixada? 

• Qual seria o erro da estimativa de acordo com os recursos financeiros de que ele 
dispõe e conforme o grau de confiança desejado? 


7.1 PARÂMETRO, ESTIMADOR E ESTIMATIVA 

Consideremos uma população Q e uma variável aleatória X que a cada elemento co da 
população associa um valor numérico X(co). Suponhamos que a distribuição de proba¬ 
bilidade de X dependa de uma determinada constante 0, cujo valor desconhecido dese¬ 
jamos estimar. 

Para isso será extraída da população uma amostra aleatória de tamanho n, e serão 
medidos os valores x,, x 2 ,x n da variável X para cada um dos n elementos da amostra. 
Esse será o nosso conjunto de dados. 

A 

Finalmente, seja0(x l5 ..., x n ) o resultado de um determinado cálculo a ser feito a par¬ 
tir dos dados para se estimar o valor de 0. 

Já que haverá um sorteio aleatório, podemos representar a coleta de dados por uma 
amostra aleatória X,, X 2 ,..., X n , no sentido em que esse conceito foi introduzido no capí¬ 
tulo anterior. Isso quer dizer que X l5 X 2 ,..., X n são como réplicas de X, ou seja, são variá¬ 
veis aleatórias iid cuja distribuição de probabilidade depende de 0. 

Nessas condições, dizemos que: 


A constante 0 é o parâmetro a ser estimado. Trata-se de uma característica fixa da 
população. 

A 

A função0(X,,..., X„) que associa a cada possível conjunto de dados x h x 2 ,..., x n 

A 

o resultado0(x!,..., x n ) é um estimador pontual do parâmetro 0. Trata-se, portan¬ 
to, de uma variável aleatória. 

A 

Cada possível valor numérico do estimador 0(x„ ...,x n ), é uma estimativa de 0. 


EXEMPLO 7.1: Como seria uma pesquisa eleitoral encomendada por 
Seu Fernando? 

Retomemos a situação de Seu Fernando, apresentada na abertura deste capítulo. A 
tabela a seguir explicita como ficaria cada um dos conceitos teóricos apresentados, den¬ 
tro do contexto de uma eventual pesquisa eleitoral encomendada por ele. 
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Conceito teórico 

Detalhamento 

População Q 

Todos os eleitores da cidade 

Vanável X 

í 1, se to votaria em Seu Fernando 

A cada eleitor co, associa X(co) = < 

[O, caso contrário 

Parâmetro p 

Proporção populacional de eleitores que votariam em Seu Fernando 

Distribuição de X 

Bemoulli(p) 

Dados X(, x 2 .x n 

Para uma amostra de n eleitores, x; = 1, se o i-ésimo eleitor da amostra vota em 
Seu Fernando; Xj = 0, caso contrário 

Amostra aleatória 

X,.x 2 . x n 

Sua descrição é semelhante à dos dados X|, x 2 .x n , exceto pelo fato de que, 

enquanto cada x, é um número (0 ou 1), cada X, é uma variável aleatória com 
distribuição Bemoulli(p) e as X,'s são iid 

Estimador pontual 

P(X,.Xn) 

A cada possível amostra de n eleitores, associa a freqüência relativa (ou 
proporção amostrai) de eleitores de Seu Fernando nessa amostra, ou seja, 

P = £ x ,/n 

Estimativa de p 

Freqüência relativa de eleitores de Seu Fernando em uma particular amostra de 
tamanho n 


EXEMPLO 7.2: Estimação do número de alunos por professor 

Admita que seja nosso propósito estimar o parâmetro y igual ao número de alunos 
por professor nas universidades brasileiras. Uma vez extraída uma amostra com n uni¬ 
versidades brasileiras, sejam: 

Yi = número de alunos na i-ésima universidade 
Xj = número de professores na i-ésima universidade 

para todo i = 1,2,..., n. 

Neste caso podemos pensar em pelo menos duas estimativas naturais para o parâme¬ 
tro y, a saber, 



t 


x ( 


(quociente entre o n e total de alunos na amostra eon ? total de professores 


na amostra) 


1 



(média amostrai do n £ de alunos por professor). 


n , i x, 

()u colocando a questão em termos de variáveis aleatórias, teríamos dois possíveis 


eslimadores de y: 



e 


y 2 = 


'V x 

n , i X, 


i-i 

Qual dessas duas formas de se estimai y sei ia preferível e por quê? Questões como 
essas podem sei analisadas a luz do material apresentado a seguir neste capítulo. 















178 ESTATÍSTICA BÁSICA 


Kl.SE VI ER 


7.2 ESTIMADOR PONTUAL DA MÉDIA POPULACIONAL 

Voltando à teoria da estimação pontual, mas focando agora no caso espcci Iico da mr(lia, 


Um estimador natural para a média populacional p = E(X) é a média amostrai 

n 

Ex, 

£ = -i±— = X. 

n 


EXEMPLO 7.3: Estimando a média do índice de Massa Corporal 

Consideremos novamente os dados do Exemplo 1.2, relativos a uma pesquisa antro- 
pométrica realizada com mulheres acima de 60 anos de idade. Admitamos que aquele 
grupo de 45 mulheres possa ser encarado como uma amostra representativa da popula¬ 
ção de todas as mulheres dessa faixa etária. Se a nossa variável de interesse for o índice 
de Massa Corporal (IMC) e desejarmos estimar a sua média populacional p, podemos 
então considerar que 

24,5+ 27,3+...+ 23,5 n 

x =-= 24,72 kg/m 2 (media amostrai) 

45 

é a nossa estimativa de p com base nos dados disponíveis. ■ 


EXEMPLO 7.4: Depósitos em conta corrente 

Sabemos que a distribuição dos depósitos em conta corrente dos clientes de um banco 
costuma ser bastante assimétrica para a direita. Isso porque, em geral, há muitos corren- 
tistas com pequeno saldo em conta corrente e poucos correntistas com grande saldo em 
conta corrente. Porém, é sabido também que, se aplicarmos à tal variável uma transfor¬ 
mação adequada, em muitos casos é possível “simetrizar” a distribuição de freqüências. 
Digamos então que, para os clientes de um certo banco, a variável ln(depósitos em conta 
corrente) siga aproximadamente um modelo Normal com média p e desvio-padrão a. 



depósito 


log(depósito) 


FIGURA 7.1 As densidades de probabilidade de depósitos 
em conta corrente e do seu logaritmo neperiano. 


Uma vez coletada uma amostra aleatória com, digamos, n = 100 clientes daquele 
banco, sejam Xj, X 2 , X 3 ,..., X 100 os valores dos logaritmos na base e de seus depósitos em 
conta corrente. As variáveis X, têm distribuição Normal(p; a 2 ), para todo i= 1,2 100. 
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M- = 



X, a média aritmética dos logaritmos neperianos dos depósitos em con¬ 


ta corrente de cada um dos 100 clientes selecionados é o estimador de p neste caso. 


Observação: Se X = ln(Y) tem distribuição Normal, então diz-se que Y tem distribuição 
lognormal. 

7.2.1 A Variável Aleatória X e sua Distribuição de Probabilidade 

Na Seção 6.4 foi visto que para diferentes amostras de tamanho n serão obtidos dife¬ 
rentes valores para o estimador. Portanto, um estimador é uma variável aleatória. 
Seja X,, X 2 , X 3 ,..., X n uma amostra aleatória, de tamanho n, de uma população em que 

a média é p e a variância é a 2 . Em linguagem matemática, E(Xj) = p e Var(X,) =ct 2 , para 
todo i. 

Enquanto o parâmetro p é uma constante, o estimador X é uma variável aleatória. 
Já vimos anteriormente (Subseção 5.3.2) que E(X) = p e Var(X) = a 2 /n. 

Além disso, se a distribuição original dos X, já é Normal, então X também tem distri¬ 
buição Normal. Mas, mesmo que essa distribuição original não seja Normal, quanto 
maior o tamanho n da amostra, mais a distribuição de X se aproxima de uma Normal, 
como vimos no Teorema Central do Limite (Seção 6.1). 

EXEMPLO 7.5: Depósitos em conta corrente (cont.) 

Retomemos o exemplo anterior dos depósitos em conta corrente em um banco. Aqui 

100 

I*. 

o estimador p = —-= X segue uma curva normal com média p e desvio-padrão 

100 

a/10. 



FIGURA 7.2 Depósitos em conta corrente 
Densidades de cada Xi e de X para n=l00, p = 3 e ct = I. 
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Observações a respeito da variância de X: 


a) 


b) 

c) 


Se a população que estamos considerando é finita, já não vale mais a independên¬ 
cia entre as X„ e pode ser provado então que a expressão anterior para a variánc ia 
de X é, na verdade, um caso particular de uma fórmula mais geral, a saber, VariX) 

= g 2 | — — — , onde n é tamanho da amostra e N é o tamanho da população. 


Vn N; 

Essa última expressão se aproxima cada vez mais da anterior, a 2 /n, à medida que 
o tamanho da população cresce indefinidamente. 

A propósito, a partir da expressão mais geral (observação (a)) podemos concluir 
que. a média amostrai se torna uma constante (Var(X) = 0), quando o tamanho 
da amostra é igual ao da população, ou seja, quando a amostra coincide com a 
população. 


7.2.2 Quão precisa é a média amostrai como estimativa da média 
populacional? 

Admita que, nesse processo de estimação, o erro absoluto máximo considerado tolerá¬ 
vel é igual a d, ou seja, é desejável que a distância entre a média amostrai e a média po¬ 
pulacional seja menor que uma certa constante d prefixada. Ocorre que, quando 
trabalhamos por amostragem, não é possível garantir que esse erro absoluto será obri¬ 
gatoriamente menor que d. 

Entretanto, se o desvio-padrão populacional a é conhecido, podemos calcular a pro¬ 
babilidade de que o erro absoluto de estimação seja menor que d, ou seja, em linguagem 
matemática: 


P[ —d < X — fj. < d 1 = P[|X-p| <d]. 
Como isso pode ser feito? 


x a 


Uma vez que E(X) = p e Var (X) = —, se admitirmos que n é suficientemente gran- 


n 


X — u 

de, então poderemos aplicar o Teorema Central do Limite. Assim, a v.a. Z = — T ^- 

c Vn 

tem distribuição aproximadamente Normal(0;l). Portanto, 


P[-d < X - p < d] = P[|X-p|<d] 


|X-p|^ d 

= P 

IZI< d 

= 20 

d j 

1 

C 

b 

c 

b 

_i 


i ; 

q 

£ 
1_ 

,%/n , 


probabilidade essa que pode ser obtida pela tabela da Normal padrão. 
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EXEMPLO 7.6: Pesquisa de ciima interno 

Foi realizada uma pesquisa de opinião em uma grande empresa visando, entre outras 
coisas, determinar o nível médio de satisfação dos empregados com as condições de tra¬ 
balho a eles oferecidas (instalações, equipamentos etc.). 

O índice de satisfação de cada empregado pode ser medido em uma escala de 0 a 100 
pontos, e sua variabilidade é tal que o desvio-padrão populacional é da ordem de 30 
pontos. Se nessa pesquisa foram sorteados ao acaso para entrevista 324 empregados, 
qual a probabilidade de que o índice de satisfação médio seja estimado com erro absolu¬ 
to menor que 5 pontos ? Observe que o erro absoluto = | Estimativa-Valor Correto |. 


Solução: 

Neste caso foi selecionada uma amostra aleatória de tamanho n = 324 empregados. 
Dessa forma temos 324 variáveis aleatórias iid X,, X 2 ,..., X n , cada uma representando o 
nível de satisfação de um empregado entrevistado, tais que g = DP(Xi) = 30, para todo i. 

Se p é a média populacional do índice de satisfação com as condições de trabalho, 
queremos calcular P[|X - p| < d], onde d=5. 

Como n=324 é bastante grande, pelo Teorema Central do Limite, podemos escrever 


P[|X-p|<d] = P 


|Z|< 


30/V324 


= P[ |Z| < 3,0 ] = 20(3) - 1 = 0,9974 


Isso quer dizer que com 99,7%, ou seja, com quase 100% de chance, o erro absoluto 
na estimação no nível médio de satisfação dos empregados será menor que 5 pontos. 


7.2.3 Cálculo do Tamanho da Amostra para Estimar a Média Populacional 

Qual deve ser o tamanho da minha amostra? Essa é certamente uma das dúvidas 
mais frequentes de quem vai iniciar uma pesquisa envolvendo coleta de dados. Quanto 
maior for a amostra, em princípio, mais precisas serão as estimativas, mas o custo tende 
a aumentar. Uma das soluções mais conhecidas é arbitrar que o tamanho da amostra 
seja uma determinada fração do tamanho da população. Entretanto, essa é uma alterna¬ 
tiva demasiadamente simplista e ingênua. A seguir mostramos que, em tais situações, a 
teoria também pode nos ajudar a tomar uma decisão quanto ao tamanho da amostra a 
ser utilizada, se formos capazes de especificar o nível de precisão desejado no processo 
de estimação do parâmetro p. 

É claro que não basta preocupar-se com o tamanho da amostra. É também de funda¬ 
mental importância que o procedimento usado na seleção dos elementos que irão com¬ 
por a amostra nos garanta uma boa representatividade. 

Pergunta: 

Lembra da pesquisa eleitoral a ser realizada na cidade de Seu Fernando para avaliar 
suas < hances de vitória, caso ele se candidatasse a prefeito? De que adiantaria usarmos 
uma grande amostra de eleitores, se esta fosse predominantemente composta por pa¬ 
rentes e amigos de Seu Fernando? Uma lai pesquisa provavelmente lhe daria uma falsa 
impressão de vitória garantida, resultado esse que poderia ser lotalmente ilusório. 
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Na discussão a seguir, estamos admitindo que será usada a amostragem aleatória 
simples (sabidamente um bom procedimento amostrai) e que, portanto, é sufit i f, nu 
que nos preocupemos em dimensionar corretamente o tamanho da amostra. 


Dimensionamento de amostra 

Para dimensionarmos a amostra, devemos fixar duas constantes: 

1. d, a distância máxima considerada tolerável entre a média amostrai e a média 
populacional. 

2. a, a probabilidade de a distância entre a média amostrai e a média populacional 
ultrapassar d. 

Simbolicamente, para calcularmos o tamanho n da amostra, devemos fixar d e 
a, ambos pequenos e tais que: 

P[|X - pl > d] = a (o que é equivalente a P[|X - p| < d] = 1 - a). 

Pode-se mostrar que, neste caso, o tamanho da amostra deve ser 



o 

FIGURA 7.3 O quantil z | £ da Normal (0,1). 


Como se justifica a fórmula para o tamanho n da amostra apresentada? 
d 


Já que P 


|Z|< 


o/Vn 


= 1 - a, então obrigatoriamente devemos ter z x = 


a Vn 


o 


que é algebricamente equivalente à referida fórmula. 


EXEMPLO 7.7: Pesquisa de clima interno (cont.) 

Voltando ao caso da pesquisa de opinião do exemplo anterior, qual deveria ser o ta¬ 
manho n da amostra de empregados a serem entrevistados para que o erro absoluto na 
estimação do índice de satisfação médio estivesse limitado em 2,5 unidades com a mes¬ 
ma probabilidade de antes, isto é, 99,74%? 

Solução: 

1 - a = 0,9974 implica em ? =3,0. Então, como aqui temos d = 2,5, o tamanho da 


nova amostra teria de ser 

















ELSEVIER 


ESTIMAÇÃO DE PARÂMETROS 183 


n = 


3,0 X 30 
2,5 


= 1296 empregados. 


Isso significa que para a tolerância máxima do erro absoluto cair à metade do que era 
antes, o tamanho da amostra terá de quadruplicar. 


E se o desvio-padrão a for desconhecido, como é o caso em várias situações concre¬ 
tas? Afinal, se não sabemos nem o valor da média, não seria de se estranhar que também 
não soubéssemos o valor do desvio-padrão! Como contornar essa dificuldade? 

Em tais situações é comum extrairmos inicialmente uma pequena amostra piloto 
com, digamos, nj elementos, com base na qual se pode obter uma estimativa prelimi¬ 


nar S, = 


2 >, - 5 )> 




do desvio-padrão a (ver Estimação do Desvio-padrão na Se¬ 


ção 7.3). Substituindo ct por sua estimativa Sj na fórmula n = 


, calcula-se 


então o tamanho da amostra a ser utilizada para que sejam atendidas as especificações 
de precisão: 


f 


n = 


z • S 3 


Depois de calcular o tamanho definitivo da amostra, pela fórmula apresentada, a 
amostra é complementada com a seleção de mais (n - n,) elementos. 


E se o tamanho N da população for finito e conhecido? 

Já vimos na Subseção 7.2.1 que neste caso há uma outra expressão matemática para a 
variância de X, a saber, Var(X) = o 2 


(l _J_ 
n N 


Que implicações isto tem no que se refere ao dimensionamento da amostra? 


Na verdade, só se a população é infinita, a fórmula n = 


/ Z !_« ^ 


nos fornece o tama- 


V y 

nho da amostra a ser utilizada para garantir que a condição P[|X - |i|< d] = 1 - a seja 

atendida (independente de se ter usado o próprio a ou uma estimativa no cálculo de n). 

I mão no caso de N sei linilo e conhecido, para que essa especificação de precisão se 

verifique basta que usemos uma amostra de tamanho 

, n 
n = 


1 + n/N 

Observação Note qu< se ik^N, então " 0 c n' S n 

N 
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EXEMPLO 7.8: Dados geológicos - Estimando a porosidade média do 1 < m k 
F oi feita uma pesquisa geológica em uma região rica em petróleo. Foram coletadas 
521 observações (localidades caracterizadas por latitude, longitude e profundidade; 
em que foi medida a porosidade do terreno. 

Consideremos esse conjunto de 521 localidades como sendo a própria população de 
interesse. O parâmetro a ser estimado é a média populacional p da variável Porosidade 
Nosso objetivo é dimensionar uma amostra de observações com base na qual será cal¬ 
culada uma estimativa X do parâmetro p, de tal forma a que possamos garantir que 


P[|X-p|< 1] =0,95 

Solução: 

Suponhamos que a, o desvio-padrão populacional da porosidade, fosse desconhecido. 
O caminho então seria a extração de uma amostra piloto com, digamos, n, = 27 ele¬ 
mentos. Uma vez extraída essa amostra, foram calculados a média e o desvio-padrão 
amostrais que resultaram ser x l = 30,47 e S, = 8,13. 

Tamanho da amostra a ser utilizada (se a população fosse infinita): 


' 1,96 x 8,13 V 

c 1 


= 254 localidades 


Tamanho da amostra a ser de fato utilizada (já que N = 521) 


n = 


254 


1 + 


254 

521 


= 171 localidades. 


Como, neste caso, a população era toda conhecida, à guisa de curiosidade, informa¬ 
mos os valores populacionais da média (30,41) e do desvio-padrão (6,31). ■ 


7.3 ESTIMAÇÃO PONTUAL DA VARIÂNCIA E DO 
DESVIO-PADRÃO POPULACIONAIS 

Seja X,, X 2 , X 3 , ..., X n uma amostra aleatória proveniente de uma população com 
E(Xj) = p e Var(X t ) = g 2 , para todo i. 


Um estimador natural para a variância populacional g 2 é a variância amostrai 

£«. -» 2 

â 2 = -= s 2 

n-1 


Consequentemente, o estimador natural para o desvio-padrão populacional, a, é 
o desvio-padrão amostrai 


£(X, -X) ! 

<J=]— -=S 

V n-l 
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Enquanto os parâmetros a 2 e a são constantes, os respectivos estimadores S 2 e S são 
variáveis aleatórias. 

Uma dúvida que surge com muita freqüência é: por que o denominador do estima- 
dor anterior é n - 1 e não n? 

Já vimos, desde o Capítulo 1, que para calcular a variância amostrai é comum prefe- 

J(X,-X ) 1 _ £(x,-x) ! 

rir-se, em vez de ô 2 = —-, a expressão ô 2 = —-= S 2 . 

n n -1 

Devemos usar n - 1 ou n no denominador da variância amostrai? 

Conforme foi visto na Subseção 5.3.2, pode ser provado que E(S 2 ) = cr 2 . 

Por outro lado, é fácil ver queô 2 =-S 2 . Portanto, pela propriedade (b) apresen- 

n 

tada na Seção 5.3.1, E(âJ) = E(— - . S 2 ) = —- . E(S 2 ) = —- . a 2 < a 2 . 

n n n 


EXEMPLO 7.9: Novamente o índice de Massa Corporal (IMC) 

Usando os dados do Exemplo 1.2, consideremos mais uma vez o IMC das mulheres 
com mais de 60 anos de idade. Aqui, temos então um desvio-padrão amostrai 


S = 


1(24,5 2 + 27,3 2 +...+23,5 2 ) - 45 x 24,72 2 


45-1 


= 2,47 kg/m 2 


que seria uma estimativa do desvio-padrão populacional a do IMC relativo a todas as 
mulheres dessa faixa etária. 


EXEMPLO 7.10: Novamente depósitos em conta corrente 

Como nos Exemplos 7.4 e 7.5, consideremos aquela amostra aleatória com n = 100 
clientes do banco. Sejam X l5 X 2 , X 3 ,..., X 100 os valores dos logaritmos neperianos de seus 
depósitos em conta corrente. Essas variáveis são iid obedecendo ao modelo Normal 


(p, a 2 ), para todo i = 1, 2, ..., 100. 

1 00 

Z(x, - x ) 2 

A variância amostrai S 2 = — 


99 


e o desvio-padrão S = 


í 


100 

X>x, -x) ! 


i=l 


99 


são cal¬ 


culados a partir dos logaritmos neperianos dos depósitos em conta corrente de cada um 
dos 100 clientes selecionados. Eles podem ser usados respectivamente como estimado¬ 
res para a variância cr 1 e para o desvio-padrão a, ambos populacionais. 


Observação: Pode sei provado que: 

a) X e V são variáveis aleatói ias independentes; 

b) No caso de X,'s Normais, a variável ÍH * ^ segue uma distribuição 

<7 

qui-quadrado com (n I ) graus dc liberdade (ver Subseção H. 10.1). 
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7.4 ESTIMAÇÃO PONTUAL DA PROPORÇÃO POPULACIONAL 

Considere uma população na qual alguns elementos possuem uma determinada < arai 
terístiea. Seja p a proporção (desconhecida) dos elementos da população que possuem 
essa característica. Uma vez coletada uma amostra aleatória com n elementos da popu 
lação, suponha que entre eles Y possuem a característica em questão. Então, Y é uma va 
riável aleatória e: 

Um estimador natural para a proporção populacional p é a proporção amostrai 

Y 

(ou frequência relativa) p = —. 

n 


EXEMPLO 7.1 I: Proporção de crianças que estão com suas vacinas em dia 
Considere a população formada por todas as crianças que moram em uma determi¬ 
nada comunidade. Seja p a proporção (desconhecida) dessas crianças que estão com 
suas vacinas em dia. Digamos que tenha sido coletada uma amostra aleatória com n = 40 
crianças dessa população e que entre elas exatamente Y estejam com as vacinas em dia. 

Y 

Então, a proporção amostrai p = — é um estimador pontual do parâmetro p. 


Vale a pena observarmos que a proporção nada mais é do que um caso particular da 
média, em que a variável de interesse é do tipo 0 ou 1. Então, muito do que foi dito sobre 
a média amostrai como estimador da média populacional vale também para a propor¬ 
ção amostrai como estimador da proporção populacional, conforme veremos nas pró¬ 
ximas subseções. 


7.4.1 A Distribuição de Probabilidade da Proporção Amostrai 

Admitamos que a nossa população de interesse seja infinita ou muito grande. Então o 
processo de amostragem pode ser representado por n variáveis aleatórias X,, X 2 , X 3 ,..., 
X n iid, tais que: 

X, = 1, se o elemento i possui a característica de interesse e 
Xj = 0, caso contrário, 
para cada i = 1,2, ..., n. 


Além disso, p é a probabilidade de que X; seja igual a 1, ou seja, p é a probabilidade de 
sucesso, em que sucesso é “possuir a característica”, o que significa que cada variável X, 
tem distribuição de Bernoulli com parâmetro p. 



A proporção amostrai pode ser calculada por p = ^-.já que a variável aleatória 

n 


Y X j representa o número de elementos da amostra que possuem a característica 
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considerada (é o número de sucessos), lembrando o que foi visto no Capítulo 4, Y tem 


distribuição Binomial com parâmetros n e p. Então, E(Y) = np e Var(Y) = np(l-p). 

Não é demais lembrarmos que aqui, novamente, o parâmetro p é uma constante, en¬ 
quanto o estimador p é uma variável aleatória. 

Usando propriedades da esperança e da variância (ver Subseção 5.3.1), concluímos 



(na prática, n > 25), a distribuição de p é aproximadamente uma Normal. 

EXEMPLO 7.12: Novamente a vacinação na comunidade 

Retomando o exemplo anterior, podemos dizer que: 

• A cada uma das n = 40 seleções aleatórias a serem feitas corresponde uma variável 
aleatória X 4 tal que: X, = 1, se a criança sorteada está com suas vacinas em dia; e X, = 0, 
caso contrário. 

• Y, o número de crianças com as vacinas em dia na amostra, obedece a uma distri¬ 
buição de probabilidade Binomial (40;p). 

- Y 

A proporção amostrai p=— segue uma lei de probabilidade aproximadamente 


40 



o 
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FIGURA 7.4 Função de probabilidade de p, quando p = 0,17 e n = 40 


7.4.2 Quão Precisa é a Proporção Amostrai como Estimador da Proporção 
Populacional? 

Suponha que o erro absoluto máximo considerado tolerável na estimação de p através de 
p é igual a d, ou seja, é desejável que a distância entre a proporção amostrai e a proporção 
populacional seja menor que uma certa constante d prefixada. Aqui, de novo, quando 
trabalhamos por amostragem, não é possível garantir que esse erro absoluto será obri¬ 
gatoriamente menoi que d, mas pode-se calcular a probabilidade de isso ocorrer. 



ção seja menor que d é 


li 
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P[|p - p|<d] = P 


“ 



lp-pl ^ d 

- P 

| 7| < Cl 

'cl 

i 

r-H 

'cl 

1 

'o. 

1 

i—H 

a 


/ P(l-P) 

_V n V n 


V n 


Já que, para todo p entre 0 e 1, p(l - p) < 1/4, P 


|Z|< 


' p(l — p) 


n 


>P[|Z|<2dVn], 


O que foi visto aqui é totalmente análogo ao que foi visto na Seção 7.2.2, lembrando 
que a proporção nada mais é do que um caso particular da média. 


EXEMPLO 7.13: TV a cabo 

Uma operadora de TV a cabo realizou uma pesquisa de mercado junto aos seus assi¬ 
nantes visando, entre outras coisas, estimar a proporção p dessas pessoas que estariam 
dispostas a contratar um upgrade no serviço que lhes é atualmente oferecido, em troca 
de um certo desconto no preço. Se for ouvida uma amostra de 30 assinantes, qual a pro¬ 
babilidade de que o erro absoluto na estimativa de p através da proporção amostrai ob¬ 
servada seja inferior a 0,1? 

Solução: 

P[|p- p|< d] > P[|Z|< 2 x 0,1 x V3Õ] = P[|Z| < 1,10] = 0,728 ou 72,8% 

Logo, se fossem tomadas muitas amostras de tamanho 30, e para cada uma delas fos¬ 
se obtida uma estimativa p de p, em cerca de 73% dos casos a distância entre p e o verda¬ 
deiro valor de p seria menor que 0,1. 


7.4.3 Dimensionamento de Amostra para Estimar a Proporção 
Populacional 

Qual deve ser o tamanho n da amostra para que a probabilidade do erro absoluto ex¬ 
ceder a tolerância d esteja limitada por um certo a, onde d e a são ambos especificados 
pelo usuário? 

Para garantir que P[|p- p|< d] = 1 - a, o tamanho da amostra deve ser 



d 

V / 


p(l-p). 


Como nessa expressão n é proporcional a p(l-p), vejamos qual é o comportamento 
do produto p(l-p) como função de p. A figura a seguir nos mostra que: 

• à medida que p varia desde 0 até 0,5, p(l-p) cresce desde 0 até 0,25; 

• para p = 0,5 a curva atinge o seu valor máximo de 0,25; 

• à medida que p varia desde 0,5 até 1, p(l-p) decresce desde 0,25 até 0. 
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FIGURA 7.5 O produto p(l-p) como função de p. 


Concluímos que quanto mais próximo p estiver de 0,50, maior terá de ser o tamanho 
de amostra para que seja atendida a especificação de precisão. 


EXEMPLO 7.14: Novamente a pesquisa eleitoral encomendada 
por Seu Fernando 

Na Introdução deste Capítulo foi apresentado Seu Fernando, interessado em se can¬ 
didatar a prefeito da sua cidade. Admitamos que ele queira determinar o tamanho da 
amostra necessária para que a sua porcentagem de eleitores seja estimada com uma pre¬ 
cisão de 2 pontos percentuais e com uma probabilidade de acerto de 95%. 

a) Qual deveria ser o tamanho amostrai? 

b) Suponha que cada entrevista custa R$80,00 e que há um custo operacional fixo, 
de R$50.000,00. Quanto custaria a realização dessa pesquisa? 

Suponha agora que Seu Fernando só dispõe de R$180.000,00 para custear a pesqui¬ 
sa. Nessas condições: 


c) Que tamanho de amostra ele deveria usar? 

d) Supondo a mesma probabilidade de confiança de 95%, qual a precisão que ele 
pode conseguir com esse tamanho de amostra? 


Solução: 

a) Temos d = 0,02 e 1 - a = 0,95, o que implica que z,_ a/2 = 1,96. 

Como nada é dito sobre o possível valor de p, usamos o valor mais conservador, 
ou seja, p = 0,5. 

Assim sendo, para garantir o nível de precisão desejado, deveriam ser ouvidos 

í i V 


n = 


0,02 j 


x 0,25 = 2401 eleitores. 


b) Custo total da pesquisa = 50.000,00 + 2401 x 80,00 = 242.080,00 

c) Valor disponível = 180.000,00 = 50.000,00 + 80,00 n 


180.000,00-50.000,00 

Daí, n =162) eleitores seria o tamanho máximo de 

80,00 

urna amostra compatível tom os recursos de Seu Fernando. 
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cl) Sendo assim, a tolerância, ou seja, o erro máximo com 95% de chance seria 
d = Z , 


■ 1 -a/2 ■ 


l P (1 ~P ) = 1,96 x 


0,5 x 0,5 


n 


1625 


= 0,024 ou 2,4%. 


Observamos que neste caso particular os recursos de Seu Fernando lhe permitem es¬ 
timar sua proporção de eleitores com uma precisão somente um pouco menor do que a 
pretendida inicialmente. 


EXEMPLO 7.1 5: TV a cabo revisitada 

Voltando ao exemplo anterior da pesquisa de mercado realizada pela operadora de 
TV a cabo, queremos determinar o tamanho da amostra suficiente para garantir que a 
proporção p de assinantes dispostos a contratar o upgrade seja estimada com um nível 
de precisão pré-especificado. Em ambas as situações a seguir, o erro absoluto deve ser 
menor que 0,08 com probabilidade 0,95: 

(a) admita que nada se sabe sobre o valor de p; 

(b) sabe-se que p está entre 20% e 35%. 


Solução: 

Já que para 1 - a = 0,95, temos, z,_„ = 1,96, o tamanho da amostra seria calculado 


pela expressão n = 


( 1,96 ^ 
0,08 


p(l-p). 


(a) Se nada se sabe sobre o valor de p, trabalhamos com o pior caso possível, ou seja, 
p = 0,5. Neste caso teríamos, então, 


n = 


' 1,96 V 
,0,08, 


x 0,25 = 150 assinantes. 


(b) Se 0,2 < p < 0,35, trabalhemos com aquele valor de p que está mais próximo de 
0,5, ou seja, p = 0,35. Sendo assim, seriam suficientes 


n = 


( 1,96 ^ 
0,08 


x 0,35 x 0,65 = 137 assinantes. 


Vale a pena lembrar que com uma amostra bem menor (n = 30, como no Exemplo 
7.13), a precisão na estimação não era tão grande como a que se pode conseguir com 
uma amostra do tamanho que acabamos de calcular (n = 137). 


7.5 VIÉS, VARIÂNCIA E ERRO QUADRÁTICO MÉDIO 
DE UM ESTIMADOR 

Voltemos agora a considerar o caso de um estimador pontual genérico 0 para um parâ 
metro 0. 
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O viés de 0 é igual à diferença entre o seu valor esperado e o valor do parâmetro. 
Simbolicamente, B(9) = E (0) - 0, onde B(0) é o viés do estimadorê. 

A 

Diz-se que o estimador© do parâmetro 0 é não-tendencioso (ou não-viciado) se 

A 

a sua esperança coincide com o valor do parâmetro, isto é, E(0) = 0. 


Portanto, se 0 é não tendencioso para 0, o seu viés é igual a zero, i.e., B(0) = 0. 

EXEMPLO 7.16: Novamente depósitos em conta corrente 

No caso dos depósitos em conta corrente: 

• X é um estimador não-tendencioso da média p de ln(depósitos em CC), porque 
E(X) = p; 

• S 2 é um estimador não-tendencioso da variância a 2 de ln(depósitos em CC). Mas 

£(X, -X) ! 

(T j =—-é um estimador tendencioso para a 2 . Na realidade, 

n 

B(ct i ) = -c 2 /n, o que significa que ao usarâ ] obteríamos sistematicamente subesti- 

mativas da variância populacional a 2 . Mais uma vez, vemos uma razão pela qual 
em geral se usa n - 1 e não n no denominador da variância amostrai. ■ 

A 

É claro que uma das propriedades de um bom estimador© é que ele seja não-tenden¬ 
cioso, mas, além disso, ele deve gerar estimativas que estejam próximas do verdadeiro 
valor do parâmetro 0. Ou seja, ainda mais importante do que ser não-tendencioso é ele 
ser um estimador preciso. 

A 

Uma medida muito usada do grau de precisão de 0 como estimador de 0 é o seu 

A» A 

erro quadrático médio, definido por EQM(0) = E[(0 — 0) 2 ] 

Como essa expressão é a média da distância ao quadrado entre o estimador e o parâ- 

A 

metro, quanto menor for EQM(0), mais preciso será o estimador. 

Pode-se provar que 

EQM(ê) = Var(0) + [B(0)] 2 

ou seja, lanto uma variância grande quanto um viés grande podem prejudicar a preci¬ 
são do estimador. 

Observação: 

y A A 

• VaríO) é uma medida da variabilidade de 0 em torno da sua esperança E(0); 
enquanto 

A A 

• |B(0) | 2 é uma medida do afastamento entre a esperança E(0) do estimador c o va¬ 
lor real 0 do parâmetro. 

A A A 

Finalmente, e claro que, se© e um estimador não-tendencioso, EQM(0) = Var(0). 
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EXEMPLO 7.17: Tiro ao alvo, uma analogia com o processo de estimação de 

parâmetros 

Consideremos um exercício de tiro ao alvo do qual participam três atiradores/esti- 
madores A, B e C. Cada um deles teve direito a vários tiros. A figura a seguir mostra o de¬ 
sempenho de cada um dos atiradores. 

Atirador A Atirador B Atirador C 




FIGURA 7.6 Atiradores vistos como estimadores pontuais. 

Fazendo uma analogia entre “atirar em um alvo” e “estimar um parâmetro”, pense¬ 
mos em cada um dos três atiradores como um estimador. À luz dessa analogia: 

• Quanto mais os tiros de um atirador se aproximarem da mosca, mais preciso ele 
estará sendo enquanto estimador (menor será o seu EQM). 

• Quanto menos trêmulo for o seu braço na hora de atirar, menor será a sua variân¬ 
cia enquanto estimador. 

• Quanto mais livre de distorções for a sua visão do local onde está a mosca, menor 
será o seu viés enquanto estimador. 

Com base na figura, podemos então montar uma tabela em que cada um dos três esti¬ 
madores é avaliado em função de sua performance no exercício de tiro ao alvo. 


Estimador 

Viés 

Variância 

Erro Quadrático Médio 

A 

Alto 

Baixa 

Alto 

B 

Nulo 

Alta 

Alto 

C 

Nulo 

Baixa 

Baixo 


• O atirador A tem uma firmeza razoável nas mãos (baixa variância), mas tem pro¬ 
blemas de visão (viés alto), o que compromete a sua precisão (EQM alto). 

• O atirador B tem uma visão perfeita (viés nulo = não-tendencioso), mas tem as 
mãos muito trêmulas na hora de atirar (alta variância), o que compromete a sua 
precisão (EQM alto). 

• O atirador C tem uma firmeza razoável nas mãos (baixa variância) e visão perfeita 
(viés nulo = não tendencioso), o que lhe garante boa precisão (EQM baixo). Por 
isso ele é o melhor entre os três atiradores/estimadores. 

Pergunta: 

Como ficaria o desempenho de um atirador correspondente a um estimador tendencio¬ 
so com variância nula? 
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EXEMPLO 7.18: Características físico-químicas do óleo diesel 

Admita que a quantidade de insolúvel total (em mg/g) no óleo diesel se comporta se¬ 
gundo uma distribuição Normal: 

• com média p, e desvio-padrão a, = 3 para as misturas não hidrogenadas; 

• com média p 2 e desvio-padrão o, = 2 para as misturas hidrogenadas. 

Está sendo planejado um experimento que consiste em, de forma independente: 

• coletar uma amostra de m misturas não hidrogenadas e medir os respectivos valo¬ 
res de insolúvel total x lt x 2 , ...,x m ; 

• coletar uma amostra de n misturas hidrogenadas e medir os respectivos valores de 
insolúvel total y b y 2> ...,y n . 

Deseja-se obter uma estimativa da diferença 0 = p,- p 2 e para isso será usado o esti- 

mador natural 0 = x - y, onde x = ^ X ‘ ■ e y = ——, 

m n 

Sabendo que o número total de misturas a serem analisadas é m + n = 40: 

a) Obtenha os valores de m e n de modo a que 0 tenha a menor variância possível. 

b) Mostre que ê é um estimador não-tendencioso de 0. 

V A 

c) Calcule o erro médio quadrático de 0, nas condições do item (a). 

Solução: 

a) Pelo resultado (1) da Subseção 5.3.2, sabemos que a variância de 0 = x - y é 

Var(0) = Var(x - y) = Var(x) + Var(y) = —+ —E = — + —— 

m n m 40 - m 

Calculemos o valor dessa variância para cada m, desde m = 1 até m = 39. 


m 

Var(0) 

m 

Var(0) 

m 

Var(0) 

m 

Var(0) 

1 

9,103 

11 

0,956 

21 

0,639 

31 

0,735 

2 

4,605 

12 

0,893 

22 

0,631 

32 

0,781 

3 

3,108 

13 

0,840 

23 

0,627 

33 

0,844 

4 

2,361 

14 

0,797 

24 

0,625 

34 

0,931 

5 

1,914 

15 

0,760 

25 

0,627 

35 

1,057 

6 

1,618 

16 

0,729 

26 

0,632 

36 

1,250 

7 

1,407 

17 

0,703 

27 

0,641 

37 

1,577 

8 

1,250 

18 

0,682 

28 

0,655 

38 

2,237 

9 

1,129 

19 

0,664 

29 

0,674 

39 

4,231 

10 

1,033 

20 

0,650 

30 

0,700 




Por esses resultados, vemos que Var(0) é mínima quando m = 24. A figura a 
seguir exibe o comportamento de Var(O) nas vizinhanças de m = 24. 

I nlão, para minimizara variância do estimador, devemos fazer m = 24en= 16. 
b) Pelo resultado (I) da Subseção 5.3.2, lemos 

1(0) = H(x y) = r(x) - E(y) = p, - p, = 0 mg/g 
Isso mostra que0 é um estimador não-tendencioso de 0. 










194 


ESTATÍSTICA BÁSICA 


ELSKVIER 


(c) Como Ô é não-tcndencioso, B(Ô) = 0 e então EQM(Ô) = VarfO) - 0,62 :> 1 mg/g) 
isto é, o valor mínimo da variância deO, que corresponde a se usarem amostras 
de 24 misturas não hidrogenadas e 16 misturas hidrogenadas. 
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FIGURA 7.7 Óleo diesel - Var(0) em função de m. • 

7.6 AS VERSÕES AMOSTRAL E POPULACIONAL DE VÁRIOS 
CONCEITOS 

Vários dos conceitos amostrais que foram estudados nos Capítulo 1 e 2 sobre Análise 
Exploratória são na verdade estimadores pontuais dos seus correspondentes conceitos 
populacionais, conforme introduzidos nos Capítulos 4 e 5. 

Assim é que: 

• a média amostrai X é um estimador natural da média populacional E(X); 

• a mediana amostrai é um estimador natural da mediana populacional; 

• a moda amostrai é um estimador natural da moda populacional; 

• a variância amostrai S 2 é um estimador natural da variância populacional Var(X); 

• o desvio-padrão amostrai S é um estimador natural do desvio-padrão populacio¬ 
nal DP(X); 

• a distância interquartil amostrai D1Q é um estimador natural da distância inter- 
quartil populacional; 

• o coeficiente de correlação amostrai r xy é um estimador natural do coeficiente de 
correlação populacional p(X,Y); 

• a covariância amostrai S xy é um estimador natural da covariância populacional 
Cov(X,Y); 

Observação: Alguns desses conceitos não foram definidos em sua versão populacional: 
mediana, moda, distância interquartil. Isso exigiria um nível de elaboração matemática 
que foge ao escopo deste livro. 


7.7 ESTIMAÇÃO POR INTERVALO 

A A 

Já vimos que se 0 é um estimador pontual do parâmetro 0,0 é uma variável aleatória e, 
por isso, há uma certa dose de incerteza inerente a esse processo de estimação. Nosso 
objetivo agora é obter, com base nos dados amostrais, um intervalo ao qual o valor cor¬ 
reto do parâmetro 0 deve ter grande chance de pertencer. 
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Detalhando um pouco mais: no processo de estimação por intervalo de um parâmetro 0, 
devemos determinar um intervalo que contenha o verdadeiro valor do parâmetro com pro¬ 
babilidade 1 - a, onde a é um pequeno valor prefixado. Esse intervalo é construído em ge¬ 
ral em tomo do estimador pontual 0, considerando uma margem de erro d, de forma que, 
uma vez fixada a probabilidade 1 - a, calculemos d tal que P(0 - d<0<ê + d) = l-a. 


Chama-se intervalo de confiança para 0, ao nível 1 - a ao intervalo [0 - d; 0 + d], 
tal que a probabilidade da distância entre o estimador e o parâmetro ser menor 

A A 

que d é igual a 1 - a, ou seja, P(0 - d<0<0 + d) = 1-a, onde a é prefixado. 


Ou seja, o estimador pontual 0 é o centro do intervalo de confiança e o erro absoluto 
d associado a 0 define a amplitude desse intervalo. 


7.7.1 Intervalo de Confiança para a Média Populacional, com o 
Desvio-padrão Conhecido 

O processo de construção desse intervalo segue uma linha de raciocínio semelhante à 
que foi usada no dimensionamento de amostra, quando o parâmetro a estimar é a média 
populacional p. Para começar, seja X b X 2 ,..., X n uma amostra aleatória com E(X t ) = p e 
Var(Xj) = a 2 , para todo i = 1,2,..., n. 

Como vimos anteriormente, na determinação do tamanho da amostra fixam-se d e 
a e calcula-se n tal que P[|X - p|< d] = 1 - a, o que equivale a: 

P [-d<X-p<d] = 1-a. (*) 

Por outro lado, na construção do intervalo de confiança, a amostra aleatória já foi co¬ 
letada e, portanto, n já foi calculado. Então, fixa-se apenas a e calcula-se d, de forma 
que a expressão (*) anterior seja atendida. 

Lembrando que para n suficientemente grande, a média amostrai X segue uma dis¬ 
tribuição que se aproxima da Normal (p; a 2 /n) (ou é exatamente a Normal (p; a 2 /n), no 
caso em que a distribuição comum das X/s já é Normal), então : 


P [-d<X-p<d] = 1-a => P[- £<—]=l-a=> 

a/Vn a/vn a Vn 

P[-^ 7 =<Z<—^=] = 1-a 

a/vn a/vn 

Isso implica que z H = ^ (y er sub-seção 7.2.3). Logo, d = z a —. 


i-- 


a/Vn 


'■? Vn 


Substituindo d na expressão (*) anterior, temos 


a 


a 


-z_ a -^<X-p<z a -= 


= 1 - a, ou equivalentemente: 
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Portanto: 


a 


X-z a ~j = — — X + z 

1_ 2 vn 



(>. 



EXEMPLO 7.19: Novamente a pesquisa de clima interno 

Retomemos a discussão dos Exemplos 7.6 e 7.7, sobre a pesquisa para determinar o 
nível médio de satisfação dos empregados. Relembrando: o índice de satisfação de cada 
empregado pode ser medido em uma escala de 0 a 100 pontos, e seu desvio-padrão po¬ 
pulacional é de 30 pontos. Foram entrevistados 324 empregados. 

Obtenha um intervalo para o índice de satisfação médio populacional ao nível de 
confiança de 98%, admitindo que a média do índice na amostra foi de 72 pontos, e inter¬ 
prete o resultado obtido. 


Solução: 

As v.a.’s iid X,, X 2 , ..., X 324 representam os níveis de satisfação dos 324 empregados 
sorteados para fazerem parte da amostra, e são tais que a = DP( X ,) = 30, para todo i. 

Os extremos do intervalo de confiança são calculados pela expressão 


X ± z 



porque aqui a é conhecido. 

ot 

Para que tenhamos 1 - a = 0,98, a = 0,02 e, consequentemente, 1 - — =0,99. 

Como x =72, z ogg = 2,33, a = 30 e n=324, o intervalo de confiança desejado é 
30 

72 ±2,33 x ~^=, ou seja, (68,12 ; 75,88). 

V324 

Neste ponto, é inevitável perguntarmos qual é a interpretação correta dos 98%, per¬ 
centual com base no qual foi construído esse intervalo de confiança: Estaria correto 

afirmar que, para a média populacional p do índice de satisfação dos empregados da 
empresa, temos 


P[ 68,12 < p< 75,88 ] =0,98 ? 

A resposta é NÃO, porque a média populacional é constante, embora seu valor seja des¬ 
conhecido. Assim, ou p pertence ou não pertence a um intervalo cujos extremos são valo¬ 
res conhecidos. Portanto, a probabilidade anterior só poderia ser igual a 1 ou igual a 0. 

Acontece que, na realidade, as variáveis aleatórias envolvidas nesse processo são os 
extremos do intervalo de confiança! 













ELSEVIER 


ESTIMAÇÃO DE PARÂMETROS 197 


Como interpretar, então, o significado do nível 0,98 associado a esse intervalo de 
confiança? 

Admita que foram extraídas 100 amostras (e não apenas uma), com n=324 emprega¬ 
dos cada uma. Então, para cada uma dessas amostras, poderia ser aplicado exatamente 
o mesmo procedimento aqui descrito e obteríamos 100 intervalos de confiança para p. 
Como o nível de confiança que caracterizou o processo de construção desses intervalos 
é de 98%, espera-se que cerca de 98 desses intervalos contenham o verdadeiro valor do 
parâmetro p, enquanto os outros dois intervalos não o conterão. 

Observação: 

1. E claro que, na prática, não seriam coletadas essas 100 amostras, mas apenas 
uma. 

2. Esse raciocínio quanto à interpretação do nível associado a um intervalo de con¬ 
fiança é absolutamente geral. 


Mas, e se o não for conhecido? 

Frequentemente, quando se pretende obter um intervalo de confiança para a média 
populacional p, o desvio-padrão populacional o é também desconhecido. Neste caso, a 
solução usual é substituir o por sua versão amostrai S. Como fazê-lo? 

No caso em que o era conhecido, fizemos uso da expressão 


Z = 


X-p 



que dava origem à variável Z com distribuição Normal padrão. 

Se, por ser g desconhecido, simplesmente o substituirmos por S na expressão e conti¬ 
nuarmos trabalhando como se a distribuição da variável assim obtida fosse ainda uma 
Normal padrão, estaremos cometendo um erro. Se o tamanho n da amostra for suficiente¬ 
mente grande, esse erro será desprezível. Entretanto, se a amostra for pequena, é necessá¬ 
rio alterar levemente a metodologia aqui apresentada: se X l5 X 2 , ..., X n é uma amostra 
aleatória da Normal (p; g 2 ), a distribuição de probabilidade da variável aleatória 


X- 

S/Vn 


é um caso particular do modelo chamado t de Student, que descreveremos brevemente 
a seguir. 


7.7.2 Noções sobre a Distribuição t de Student 

Algumas observações gerais sobre a distribuição t de Student: 

I A distribuição i de Student é, juntamente com a Qui-quadrado e a F de Fisher- 
Snedecor, uma das distribuições de probabilidade derivadas da Normal. 

2. A i de Student depende do parâmetro v, um número inteiro e positivo chamado 
numero de graus de liberdade. 
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3. Assim como acontece com a Normal padrão, a função de densidade da t de Stu- 
denté também uma curva simétrica e centrada em zero, porém ela é mais disper¬ 
sa em torno de zero que a Normal padrão. 

4. À medida que o número de graus de liberdade v tende a infinito, a curva da I de 
Student se aproxima cada vez mais da curva da Normal padrão. (Basta observar 
uma tabela da t de Student para constatar que, dado um valor fixo de a, quando v 
cresce, o quantil 1 - a da t com v graus de liberdade se aproxima cada vez mais 
do quantil 1 - a da Normal padrão.) 

5. O cálculo de probabilidades associadas à t de Student também pode ser feito com 
o auxílio de um software estatístico ou através de consulta a uma tabela de pro¬ 
babilidade, como a Tabela II do Apêndice II. 

6. Para mais detalhes sobre a t de Student, ver as Referências Bibliográficas. 

Na figura a seguir, as três linhas representam a distribuição t de Student com núme¬ 
ros de graus de liberdade iguais a 1, 2 e 5. A título de comparação, foi desenhada, com 
uma linha mais grossa, uma Normal padronizada. 



FIGURA 7.8 A densidade da t de Student para diversos valores de v. 

Uso da tabela da t de Student 

Admita que a v.a. T segue uma distribuição t de Student com v graus de liberdade. A 
figura a seguir mostra a função densidade de T. 

Notação: 

• p representa a área sob a curva e à esquerda de t 

• t p representa um valor da variável T, também chamado quantil de T, à esquerda do 
qual há uma área p. 

Em símbolos: p = P[T < t p 1 



FIGURA 7.9 Usando a tabela da t de Student. 
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A explicação será feita com base em exemplos numéricos. 

1. Determinação de t p a partir do número de graus de liberdade v e da probabilida¬ 
de p. 

Exemplos: 

• Se v = 6 e p = 0,90 -> to 90 = 1,440. 

• Se v = 3 e p = 0,995 -> to 995 = 5,841. 

Determinação de p = P[T < t p ] a partir de v e t p . 

Exemplos: 

• Se v = 10 e t p = 2,31 —> Pela tabela, vemos que p = P[T < 2,311 está entre 0,975 e 
0,98 

• Se v = 4 e t p = 0,88 —> Pela tabela, p = P[T < 0,88] está entre 0,70 e 0,80. 

Observação: Para uma maior precisão, pode ser feita uma interpolação ou então ser 
usado um software estatístico. 


7.7.3 Intervalo de Confiança para a Média Populacional, com o 
Desvio-padrão Desconhecido 

Voltando à pergunta do final da Seção 7.7.1: como construir o intervalo de confiança 
para a média populacional, quando não se conhece o verdadeiro valor a do des¬ 
vio-padrão populacional? 

A fundamentação teórica para isso se baseia no fato de que, se as X;’s são variáveis ale¬ 


atórias iid cuja distribuição comum é Normal (p,cj 2 ), a variável aleatória 


X-p 

S/Vn 


segue 


uma distribuição t de Student com (n - 1) graus de liberdade. 


Neste caso, a solução usual é substituir a por sua versão amostrai S = 


2>, -x) 2 


i=l 


n -1 


E, por isso, z a também tem de ser substituído pelo quantil t a , extraído da distribui- 

i - 1 


ção t de Student com (n - 1) graus de liberdade. 



EXEMPLO 7.20: Novamente o índice de Massa Corporal 

Usando os dados do Exemplo 1.2, que trata de pesquisa antropométrica com mu¬ 
lheres acima de 60 anos, podemos agora obter um intervalo a 95% de confiança para a 
média populacional p do índice de Massa Corporal. Para a amostra disponível, temos 
x= 24,72 e S = 2,47. Por outro lado, 
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n = 45 => v = n - I = 44 e 

l - a = 0,95 => a = 0,05 =>!- — = 0,975 

2 


Logo, to , 97 5 = 2,015. 

Os extremos do intervalo de confiança no nível de 95% são então 


2,015x2,47 , . , 

24,72 - —-— = 23,98 kg/m 2 

V45 


24,72 + 2,0 = 25,46 kg/m 
V45 


7.7.4 Intervalo de Confiança para a Proporção Populacional 

Sabemos que a proporção p dos elementos de uma população que possuem determi¬ 
nada característica pode ser vista como a esperança de uma variável binária, ou seja, 
uma variável que assume o valor 1 para os elementos em que a característica está pre¬ 
sente e o valor 0 para aqueles em que ela está ausente. Já vimos também que neste 
caso, uma vez extraída uma amostra aleatória com n elementos dessa população, o es- 


timador natural de p é a proporção amostrai 



onde os X, são v.a.s iid com 


distribuição Bernoulli(p). 

Como obter um intervalo de confiança para p a partir dos dados? 

Já que a proporção é um caso particular da média, e, além disso, cada X, tem esperan¬ 
ça p e desvio-padrão ypf 1 - p), podemos concluir também que (para n suficientemente 
grande, de modo a ser válido o Teorema Central do Limite) 


1 - a = P 


p(l-p) „ p(l-p) 

P~ z . «i--— <p<p + z £- 


n 


n 


A questão agora é que o próprio parâmetro p está aparecendo no cálculo dos extre¬ 
mos desse intervalo. Queremos então substituí-lo por algo que só dependa dos dados. 
Dois caminhos são possíveis para resolvermos essa dificuldade: 

• Lembrando mais uma vez que o produto p(1 - p) é menor ou igual a %, para todo p: 


O intervalo de confianç 

a conservativo para p ao nível 

í 1 1 > 

P- z , . r-’P + z , a r~ 
t I V4n '-jV4nJ 

1 - a é 

• Substituindo simplesmente p por sua estimativa p nessa expressão: 

O intervalo de c< 

jnfiança não conservativo para p ao nív 

f. /p(l-p) . , /p(l-p)í 

r 5-W n ’ P + Z '-f\ n 

el 1 - a é 
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Evidentemente, a opção conservativa sempre nos levará a intervalos de maior ampli¬ 
tude do que a opção não conservativa. 

EXEMPLO 7.21: Novamente TV a cabo 

Retomemos os Exemplos 7.13 e 7.15, em que analisamos uma pesquisa de mercado 
feita por uma operadora de TV a cabo junto aos seus assinantes. Foi ouvida uma amos¬ 
tra de 30 assinantes e, com base nos dados levantados, deseja-se construir um intervalo 
de confiança para a proporção p dessas pessoas que estariam dispostas a contratar um 
upgrade no serviço que lhes é atualmente oferecido, em troca de um certo desconto no 
preço. Admita que 9 entre os 30 respondentes manifestaram-se propensos a aderir a 
essa oferta. Obtenha um intervalo para p a 95% de confiança. 

Solução: 

9 

Com base nos dados, p = — =0,30. Por outro lado, como a = 0,05, z 0975 = 1,96. 

Usando a opção conservativa, o intervalo de confiança seria então: 

0,30 ± 1,96 x - 1 - , ou seja, (0,121; 0,479) 

V4x30 

Usando a opção não conservativa, o intervalo de confiança seria então: 

0,30 ± 1,96 x J gjOxOTO ou . ( 0136; 0>464) 

V 30 



EXEMPLO 7.22: Intervalo de confiança para a proporção de eleitores que 
apóiam Seu Fernando 

Digamos que tenha sido realizada uma pesquisa na cidade de Seu Fernando em que: 

• n = 1625 eleitores (ver Exemplo 7.14) foram ouvidos quanto às suas preferências 
na eleição para prefeito; 

• entre eles m = 475 revelaram sua intenção de votar em Seu Fernando. 

Obtenha um intervalo a 99% de confiança para a proporção p de eleitores que apói¬ 
am a candidatura de seu Fernando, com base nesses dados. 

Solução: 

475 

Aqui temos p =-= 0,292. 

1625 

Por outro lado, 1 - a = 0,99 => a = 0,01 => 1 - y = 0,995 => z 0995 = 2,58. 

Então, usando a opção não conservativa, os extremos do intervalo de confiança são 


0,292 ± 2,58, 


0,292 x(l -0,292) 


, ou seja, (0,263; 0,321). 


1625 
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Pergunta: 

Como você interpretaria o significado dos intervalos de confiança nos Exemplos 
7.20, 7.21 e 7.22? 

Isso encerra o material a ser visto neste livro sobre Estimação de Parâmetros. 

Há vários outros tópicos que também costumam ser abordados na literatura (ver Re¬ 
ferências Bibliográficas), como, por exemplo, estimadores de Máxima Verossimilhan¬ 
ça, métodos Bayesianos de estimação etc., mas que não serão aqui apresentados. 


RESUMO DO CAPÍTULO 7 

• No estudo da Inferência Estatística, três termos aparecem com muita frequência: 

Parâmetro 0 - é uma característica fixa da população, em geral com valor 
desconhecido e a ser estimado. 

Estimador pontual do parâmetro 0 - é a função 0 (X,,..., X n ) que associa a 

A 

cada possível conjunto de dados amostrais x l5 x 2 , ..., x n o valor 0(x,, ..., x n ). 
Estimativa de 0 - é um possível valor numérico do estimador. 

• Estimadores pontuais dos principais parâmetros populacionais 


Parâmetro populacional 

Estimador 

Média. |i 

n 

2X 

Média amostrai = X = — 

n 

Variância, c 2 

Ê(x,-x ) 2 

Variância amostrai = S 2 = —- 

n -1 

Desvio-padrão, a 

Desvio-padrão amostrai = S = y/s* 

Proporção, p 

n 

Sx, 

Proporção amostrai = freqüência relativa = p = ——, 

n 

onde os X, são todos iguais a 0 ou 1 


• O tamanho da amostra necessário para se estimar a média populacional p com 

um nível de precisão dado por P[|X - p|< d] = 1 - a, onde a e d são constantes 
prefixadas, é calculado pela expressão 



d 


V 7 

Quando a é conhecido, usamos a fórmula diretamente. Quando ct é desconhe¬ 
cido, recomenda-se substituir o seu valor na fórmula por uma estimativa baseada 
em conhecimentos prévios do fenômeno ou na extração de uma amostra piloto. 
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• O tamanho da amostra necessário para se estimar a proporção populacional p 
com um nível de precisão dado por P [ |p - p|< d] = 1 - a, onde a e d são constan¬ 
tes prefixadas, é calculado pela expressão 


n = 


p(l-p) 


Como o produto p(l - p) é sempre menor ou igual a 0,25: se p for totalmente 
desconhecido, usamos p(l - p) = 0,25 na expressão; se for conhecido um intervalo 
de valores possíveis para p, usa-se o valor desse intervalo que maximiza o produto 
p(l - p), isto é, o valor de p que torna o produto p(l - p) mais próximo de 0,25. 

• Dado um parâmetro 0 genérico, um intervalo de confiança para 0, ao nível 
1 - a é um intervalo de valores, construído a partir dos dados disponíveis, que 
contém o verdadeiro valor do parâmetro com probabilidade 1-a, em que a é 
um pequeno valor prefixado. 

• Intervalos de confiança para a média e para a proporção populacionais: 


Parâmetro 

Condição 

Intervalo de confiança ao nível 1 - a 

P 

a conhecido 


( \ 
t} a — o 

Z| -j Vn ' X + Z ,-| Vn ^ 


P 

o desconhecido 


— S — S 

X-t a -j=\X + t a —j= 


P 

intercalo conseivativo 


P z ,-!V4^ P+Z .-fV^ 

\ 

P 

intervalo não-conseo/ativo 

« _ /P(!-P) - . _ /PO-P) 

1 '-v n 'ir n J 


Observação: Nessas expressões, z a é o quantil da Normal padrão tal que 

(X z 

P[Z<z a ]=l -e t a é o quantil da t de Student com (n-1) g.l. tal que 

1_ 2 ^ 1_ 2 

P[T< t| _J=1—^ 

• A distribuição t de Student é uma das distribuições de probabilidade derivadas 
da Normal. Ela depende do parâmetro v, um número inteiro e positivo chama¬ 
do número de graus de liberdade. A função de densidade da t de Student é uma 
curva simétrica e centrada em zero, sendo mais dispersa em torno de zero que a 
Normal padrão. Neste capítulo ela foi usada para se construir intervalos de con¬ 
fiança para a média populacional p, quando a é desconhecido. No Capítulo 8 
ela será usada nos testes para comparação de duas médias populacionais, tanto 
no caso pareado como no caso não-pareado. 
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EXERCÍCIOS RESOLVIDOS 


7.I R) Controle de qualidade na venda de resistores 

Um fabricante de equipamentos eletrônicos vende resistores, cujo valor nominal da 
resistência elétrica é de 47 kQ, em lotes de 500 unidades, ao preço de 1.500,00 u.m. o 
lote. O seu custo de fabricação é de 2,00 u.m. a unidade. Admita que o valor da resistên¬ 
cia elétrica de um tal resistor na verdade se comporta como uma variável aleatória com 
média p e desvio-padrão 1 kQ. Ocorre que os compradores exigem que, antes de fecha¬ 
do um negócio, seja extraída do lote uma amostra aleatória simples com n resistores, 
cujas resistências elétricas x u x 2 , x 3 , ..., x n são medidas, e a venda só se concretiza se 


|x - 471 < 0,2 (em kQ) 


Caso contrário, o lote é inutilizado. 

a) Que tamanho mínimo n da amostra o vendedor deve propor que seja utilizado, 
para que o seu lucro esperado em cada lote seja de pelo menos 400,00 u.m., no 
caso de o processo produtivo estar perfeitamente regulado, isto é, p = 47 kQ ? 

b) Usando o valor de n calculado em (a), qual o lucro esperado do vendedor em cada 
lote, se p = 46,9 kQ (ou seja, se há uma pequena desregulagem no processo)? 

c) E se p = 46,8 kQ? 

Solução: 

Lucro = Receita - Despesa, sendo que 
f 1500, se | x - 47|< 0,2 

Receita = 4 e Despesa = 2 x 500 = 1000 

[0, caso contrário 

Então 


E(Lucro) = $1500 . P[46,8 < x< 47,2] - $1000 = 


= 1500. 


f 

o 

( a- r > 

47,2 -p 

-O 

'46,8 -p V 


l/Vn J 


1 !M> JJ 


- 1000 


a ) Se p = 47, para que E(Lucro) > $400, devemos ter 


1500 (0(0, 2Vn) - O(-0,2Vn)} - 1000 > 400. 


Por outro lado, devido à simetria da curva Normal, temos 


O(-a) = 1 - O(a), ou seja, O(a) - O(-a) = 20(a) - 1 


Então, 20(0,2 Vn) - 1 > 
deve ser de pelo menos 


400 +1000 . , 

-, o que implica que 

1500 F M 


o tamanho n da amostra 


( 

50 1 


V 


í—)T 

,30 J, 


= 84 resistores. 
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b) Se p = 46,9 e n = 84, então 
E(Lucro) = 1500 


f 

Cp 

' 47,2 - 46,9 " 

-Cp 

' 46,8 - 46,9 V 

V 

1 1/V84 J 


1 1/V84 JJ 


- 1000 = $225,98 


c ) Se jj. = 46,8 e n = 84, então 
E(Lucro) = 1500 


/ 

Cp 

' 47,2 - 46,8" 

-cp 

' 46,8 - 46,8 y 

V 

1 1/V84 J 


l/>/84 J J 


- 1000 = -$250,19 


Ou seja, neste caso o nível da desregulagem já seria suficiente para gerar uma expec¬ 
tativa de prejuízo. 

7.2_R) Intervalo de confiança para o índice Cardíaco Médio 

Foi realizada uma pesquisa envolvendo uma amostra de 600 pacientes de um certo 
hospital. Cada um desses pacientes foi submetido a uma série de exames clínicos e, en¬ 
tre outras coisas, mediu-se o índice Cardíaco (em litros/min/m 2 ) de todos eles. Os 600 
pacientes foram então classificados, de forma aleatória, em 40 grupos de 15 pacientes 
cada. Para um desses grupos, os valores medidos do índice Cardíaco foram: 405, 348, 
365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172. 

a) Com base nesses valores, construa um intervalo de confiança para o valor médio 
p do índice cardíaco ao nível de 95%. 

b) Se para cada um desses 40 grupos de 15 pacientes fosse construído um intervalo 
de confiança para p ao nível de 95%, quantos desses intervalos se espera que não 
conteriam a verdadeira média populacional no seu interior? Por quê? 

Solução: 

a) A média e o desvio-padrão amostrais calculados a partir dos dados anteriores são 
x = 312,73 e S = 185,80. Por outro lado, o quantil da t de Student com 15-1 = 14 

graus de liberdade correspondente a 1 - ~~ = 0,975 é 2,145. Os extremos do in¬ 
tervalo de confiança para o índice cardíaco médio, a 95% de confiança, são, por¬ 
tanto: 

185 80 

312,73 ± 2,145 x —ou seja, o intervalo é (209,84; 415,63), sendo esses va- 

VÍ5 

lores expressos em litros/min/m 2 . 

b) Como o valor de a adotado no caso foi 0,05, cerca de 5%, ou seja, 2 dos 40 inter¬ 
valos de confiança assim obtidos não conteriam em seu interior a verdadeira mé¬ 
dia populacional. 
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7.3_R) Precisão expressa em termos de erro relativo 

Em cada uma das situações a seguir, determine o tamanho n da amostra n< < < >;ino 


para garantir que o erro relativo 
com probabilidade 0,95. 


p-p 


na estimação da proporção p seja inferior a 20% 


a) p = 0,5 (por exemplo, p é a proporção de mulheres em uma população, em que 
há um certo equilíbrio entre os dois sexos) 

b) p = 0,05 (por exemplo, p é a proporção de pessoas canhotas na população) 

c) p = 0,005 (por exemplo, p é a proporção de albinos na população) 

d) Que conclusões podem ser extraídas dos resultados? 


Solução: 

Vamos trabalhar aqui como se a população fosse infinita. 

A 

p-p 


Queremos que P 


< 0,20 


= 0,95, o que é equivalente a P[|p-p| <0,20p] =0,95. 


O limitante do erro absoluto é então d = 0,20p. Sabemos que E(p) = p e 

Var(p) = ——. Ou seja, neste caso, temos p = p e a 2 = p(l- p). Então, esse resultado 

n 

implica que o tamanho da amostra deve ser 

1,96 


f 1 V 


n= 


0,20p 


a) Para p = 0,5, n = 


0,5 ( 1,96 ^ 


0,5 


0,20 


p(1 _ p)= IzPÍi*n 

P v 0,20 


= 96. 


b) Para p = 0,05, n = 


0,95 ( 1,96 ^ 


0,05 


0,20 


= 1825. 


c) Para p = 0,005, n = 


0,995 í 1,96 ^ 
0,005 v 0,20 


= 19112. 


d) Isso mostra que, quando se trata de estimar uma proporção p, para que se pos¬ 
sa garantir uma boa precisão em termos de erro relativo, à medida que p se 
aproxima de zero (atributo muito raro), o tamanho da amostra cresce indefini¬ 
damente. 

Observação: Note que, se a exigência de precisão é expressa em termos do erro abso¬ 
luto, o tamanho da amostra é máximo quando p = 0,5. 


7.4_R) Gasto mensal das famílias com alimentação 

Deseja-se estimar o gasto mensal médio p com alimentação das famílias de uma de¬ 
terminada cidade. O procedimento proposto consiste em entrevistar n = 100 famílias e 
adotar a média aritmética X dos seus gastos mensais em alimentação como uma estima- 
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tiva do parâmetro de interesse. Consultando estatísticas de períodos anteriores, verifi¬ 
ca-se que o coeficiente de variação do gasto familiar mensal em alimentação nessa 
cidade tem oscilado pouco ao longo do tempo em torno de 0,5. Assim sendo, aqui ele 
será considerado conhecido e igual a 0,5. 


a) 


Qual a probabilidade de que o erro relativo 


X-p 


não exceda 5%? 


b) Calcule e para que o erro relativo seja menor que e com probabilidade 0,9. 

c) Qual o menor valor de n necessário para que o erro relativo não exceda 5% com 
probabilidade 0,9? 


Observação: 

Neste problema você pode trabalhar como se a população da cidade fosse infinita. 


Solução: 

Sabemos que a/p = 0,5, onde p e a são, respectivamente, a média e o desvio-padrão 

populacionais do consumo familiar mensal em alimentação. 

Usando a aproximação dada pelo Teorema Central do Limite, temos: 


1-a =P 

IX — pl 
- — < 8 

= P 

|X - p| ^ eVn 

= P 

11 

VI 

N 


P 


=L 

C 

> 

b 

_i 


a/p _ 


>Vn 


Isso implica que z a = . (*) 

2 


a/p 


a ) Substituindo em (*) os valores 8 = 0,05 e n = 100, temos 
0,05 100 _ ^ onde se conclui que 1 - a = 0,68. 


= 


0,5 


Isso quer dizer que, se usarmos uma amostra com 100 famílias, há uma pro¬ 
babilidade de 68% de que o erro relativo na estimativa do consumo médio men¬ 
sal em alimentação seja inferior a 5%. 

* a -tf/b 


b) A partir da relação (*) deduz-se que 8 = 

• 1 - a = 0,90 implica que z a = 1,64 

2 

• n = 100 e a/p = 0,5 


í— 


Vn 


-. Por outro lado: 


Logo 8 = 1 ’ 6 ^ = 0 - 5 = 0,082 ou 8,2%. 

VTÕÕ 

Novamente, com uma amostra de 100 famílias, há uma probabilidade de 90% 
de que o erro relativo na estimativa do consumo médio mensal em alimentação 

seja inferior a 8,2%. , ,2 

a 

* “ “ 

— y l Ll 

c) A partir da relação (*) obtemos também n = - 2 — -- . 


























208 ESTATÍSTICA BÁSICA 


ELSEVTER 


Substituindo nessa expressão z „ = 1,64 e c = 0,05, obtemos 
1,64 2 x 0,5 2 

n = —--— s 269. 

0,05 2 

Logo, para que, com 90% de chance, o erro relativo de estimação seja menor 
que 5%, temos de usar uma amostra com 269 famílias. 


EXERCÍCIOS PROPOSTOS 

7.I_P) IMC: Ilustrando conceitos básicos 

No Exemplo 7.3 (índice de Massa Corporal), descreva o que são: a população, a va¬ 
riável aleatória de interesse X, o parâmetro que se deseja estimar, a distribuição de X, a 
amostra aleatória, os dados, o estimador pontual e a estimativa pontual considerando 
os dados. 

7.2_P) Depósito em contas bancárias: Ilustrando conceitos básicos 

Considerando o Exemplo 7.4: 

a) Repita o exercício anterior. 

b) Suponha que seja coletada uma amostra aleatória formada por 100 contas e se¬ 
jam obtidos os valores de depósito que constam no arquivo deposito_cc.xls, 
disponível no site www.campus.com.br. Calcule a estimativa pontual da média e 
do desvio-padrão populacional de ln(depósitos). 

7.3_P) Estimação da resistência média de um material 

Um pesquisador está estudando a resistência de um certo material sob determinadas 
condições. Ele sabe que essa variável é normalmente distribuída com variância igual a 4 
unidades 2 . 

Foi extraída uma amostra aleatória de tamanho 10, obtendo-se os seguintes valores: 

7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 4,4 5,9 

a) Calcule a estimativa pontual da média populacional, com base nesta amostra. 

b) Determine o intervalo de confiança para a resistência média com um coeficiente 
de confiança de 100(1 - a) = 90%. 

c) Qual o tamanho da amostra necessário para que o erro cometido, ao estimarmos 
a resistência média, não seja superior a 0,1 unidade com probabilidade 0,90? E 
se quiséssemos um erro máximo de 0,01 unidade com a mesma probabilidade? 

d) Suponha que no item (b) não fosse conhecido o desvio-padrão. Como você pro¬ 
cederia para determinar o intervalo de confiança para a média populacional, e 
que suposições você faria para isso? 

7.4_P) Intervalo de confiança para o conteúdo médio de sódio no sangue 

Deseja-se estimar o conteúdo médio p de sódio no sangue dos indivíduos que sofrem 
de uma determinada doença. Para isso foi coletada uma amostra de 16 pacientes com 
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essa doença e em cada um deles se mediu o conteúdo de sódio no sangue (em mmol/1) 
tendo sido obtidos os valores 

138 142 146 139 149 141 142 145 

142 136 139 144 136 138 142 140 

Admitindo que o conteúdo de sódio no sangue desses indivíduos obedece a uma dis¬ 
tribuição Normal: 

a) Calcule as estimativas pontuais da média, do desvio-padrão e da mediana popu¬ 
lacionais, com base nessa amostra. 

b) Obtenha um intervalo de confiança a 95% para a média populacional, p. 

c) Calcule qual deve ser o tamanho de uma nova amostra de pacientes a partir da 
qual se possa obter um intervalo de confiança a 95% para p com amplitude igual 
a 1/5 da amplitude do intervalo obtido em (b). 

Observação: Note que estimativas do mesmo parâmetro a obtidas com base nessas 
duas amostras devem estar próximas entre si. E lembre-se de que, se v é suficientemente 
grande, a t de Student com v graus de liberdade praticamente se confunde com a Nor¬ 
mal (0;1). 

7.5_P) Intervalos de confiança encaixados 

Deseja-se estimar a média p de peso de uma determinada população através de um 
intervalo de confiança. Foi obtida uma primeira amostra com n, = 20 pessoas e com 
base nos dados obtidos calcularam-se x x = 68,7 kg e S, = 5,36 kg. Foi obtida uma segun¬ 
da amostra com n 2 = 30 pessoas e com base nos dados obtidos calcularam-se x 2 = 69,3 kg 
eS 2 = 6,08 kg. 

a) Obtenha um intervalo I, a 95% de confiança para p com base na primeira 
amostra. 

b) Queremos construir um intervalo de confiança 1 2 para p com base na segunda 
amostra de modo que ele esteja totalmente contido no intervalo I 2 obtido no 
item (a). Usando somente as possibilidades oferecidas pela tabela da t de Stu¬ 
dent (Tabela II do Apêndice II), qual o maior nível de confiança que pode ser 
usado para se obter o intervalo I 2 ? Quais seriam os extremos desse intervalo de 
confiança? 

7.6 P) Significado do intervalo de confiança para o índice 
de satisfação médio do cliente 

Levando em conta simultaneamente as respostas dadas por 200 clientes de uma em¬ 
presa a todos os itens de um questionário, foi calculado um índice de satisfação global 
correspondente a cada respondente. Ele pode variar desde 0 (totalmente insatisfeito) 
atí 100 (totalmente satisfeito). Com respeito a esse índice de satisfação, foi construído 
um intervalo de confiança a 95% para a sua média populacional, que vai desde 43,5 até 
63 9 Quais das seguintes afirmações estão corretas e quais não estão? Por quê? 
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a) A probabilidade de que a verdadeira média populacional do índice de satisfação 
esteja entre 43,5 e 63,9 é 95%. 

b) Se fosse extraída uma outra amostra, também com 200 clientes, a probabilidade 
de a média (amostrai) dos índices de satisfação correspondentes a essa nova 
amostra estar entre 43,5 e 63,9 seria de 95%. 

c) Se fossem extraídas 100 amostras, todas elas com 200 clientes, e (usando o mes¬ 
mo procedimento que deu origem ao intervalo de 43,5 a 63,9) fosse construído 
um intervalo de confiança a 95% para cada uma delas, cerca de 95 desses interva¬ 
los conteriam dentro de si a verdadeira média populacional. 

d) O desvio-padrão populacional do índice de satisfação é aproximadamente igual 
a 5,1. 

e) Todos os entrevistados têm seus índices de satisfação entre 43,5 e 63,9. 


7.7_P) Dimensionamento de amostra a partir da precisão 
projetada para o estimador da média 

Deseja-se estimar a média de uma variável definida sobre uma população de tama¬ 
nho N = 1.000 através de uma amostragem aleatória simples. 

a) Qual deve ser o tamanho da amostra utilizada para que a variância do estimador 
da média seja igual a 1/50 da variância da variável na população? 

b) Responda a mesma pergunta se agora o desvio-padrão do estimador da média 
deve ser igual a 1/50 do desvio-padrão da variável na população. 


Sugestão: Lembre-se da fórmula mais geral para a variância da média amostrai: 


Var(x) = a 



vn 


n 

N y 


7.8_P) Estimando a população de uma área 

Uma amostra aleatória de 30 famílias foi selecionada de uma população de 14.361 fa¬ 
mílias residentes em uma determinada área urbana. O número de pessoas em cada fa¬ 
mília da amostra é: 

426432364552345 I 2543232542 I 525 

Estimar o número total de pessoas na área e calcular a probabilidade de que essa esti¬ 
mativa esteja a ± 20% do valor correto. 

7.9_P) Os pesos dos recém-nascidos 

Use como população os pesos em kg dos N = 5 recém-nascidos do Exemplo 1.17, a 
saber: 

2,3 2,5 3,0 3,5 4,0. 

a) Calcule a média p e a variância a 2 populacionais. 

b) Obtenha todas as 10 possíveis amostras de tamanho n = 2. 
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c) Calcule a média amostrai x para cada uma delas. 

d) Use esses valores para confirmar a validade das expressões E(X) 


= p e 


Var(x) = a 2 f — - — 
ln N 


\ 


neste caso. 


7.I0_P) Novamente a pesquisa antropométrica 

Usando os dados da Tabela 1.2 (Pesquisa antropométrica), obtenha intervalos de 
confiança a 95% para: 

a) a média populacional p da relação cintura-quadril; 

b) a proporção p de mulheres com sobrepeso. 



CAPÍTULO 8 


TESTES DE HIPÓTESE 


CONCEITOS A SEREM INTRODUZIDOS NESTE CAPÍTULO: 

• Procedimento de teste de hipótese 

• Hipótese nula e hipótese alternativa 

• Estatística de teste 

• Região de aceitação e região de rejeição 

• Erro I e Erro II 

• Probabilidades de erro: ae(3 

• Hipótese simples e hipótese composta 

• Poder do teste 

• Nível de significância, nível crítico ou valor-p 

• Teste bilateral e teste unilateral 

• Teste de proporção 

• Teste t para amostras não-pareadas 

• Teste t para amostras pareadas 

• Distribuição F de Fisher-Snedecor 

• Análise de Variância (ANOVA) - Comparações múltiplas 

• Distribuição qui-quadrado 

• Teste qui-quadrado para independência 

Propaganda enganosa? 

A propaganda da Companhia de Cigarros Tabacox afirma que o teor médio de nicotina dos 
cigarros da marca Delicious, que ela fabrica, é no máximo de 0 ,7 mg. Um organismo fiscalizador 
analisa 1 6 cigarros dessa marca, obtendo um valor médio para a amostra analisada de 0,708 
mg de nicotina. 0 organismo decide denunciar o fabricante à Justiça, que o autua por propagan¬ 
da enganosa e o condena a pagar uma elevada multa. 

A Companhia decide recorrer. 0 seu advogado contrata um estatístico para saber se tem al¬ 
guma chance de ganhar o recurso. 0 estatístico solicita os dados relativos às análises feitas pelo 
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organismo fiscalizador e calcula as estatísticas adequadas. Sorrindo, diz para o advogado da 
Companhia: “Não tem problema não, pode apresentar o recurso.” Dias depois, o recurso é defe¬ 
rido, e a sentença inicial é revogada. 

A tranquilidade do estatístico e sua confiança no julgamento positivo do recurso residem no 
conhecimento da teoria estatística, que, por meio de um teste de hipótese, lhe permitiram verifi¬ 
car que uma média amostrai de 0,708 mg pode muito provavelmente ser proveniente de uma 
população com média 0,7mg. Para o advogado e para a diretoria da Companhia, ficou evidente 
a conveniência de se ter algum conhecimento das técnicas estatísticas, mesmo em uma área 
aparentemente tão distante da Estatística como o Direito. 

Algumas outras situações em que a metodologia dos testes de hipótese pode ser utili¬ 
zada para dirimir questões aparentemente controversas: 

• Será que o fato de a TV transmitir um debate entre os dois únicos candidatos em 
uma eleição presidencial pode alterar significativamente as chances de vitória de 
cada um? 

• Será que existem diferenças expressivas entre as eficácias de cinco diferentes 
tratamentos para combater uma determinada doença? 

• Será que existe relação entre o nível de estresse de um trabalhador e o tipo de 
atividade que ele realiza dentro da sua empresa? 


8.1 CONCEITOS BÁSICOS 

Um procedimento de teste de hipótese permite avaliar a validade (ou não) de uma afirma¬ 
ção sobre uma determinada característica da população, usando para isso os dados de 
uma amostra retirada dessa população. Essa característica é representada por uma variá¬ 
vel aleatória contínua X, cujo comportamento probabilístico é expresso por sua função 
densidade de probabilidade f. Admita que f depende de um parâmetro 0, cujo valor é des¬ 
conhecido. Deseja-se, através de um experimento envolvendo a coleta de dados, decidir 
entre duas afirmações mutuamente excludentes a respeito do valor correto de 0: 

a hipótese nula H 0 

e 

a hipótese alternativa H t 

Seja X, X,,..., X„ uma amostra aleatória proveniente da população. Como antes, os 
valores observados das variáveis X,, X 2 ,..., X„ correspondem aos dados levantados ex- 
perimentalmente. 

Deseja-se estabelecer um critério de decisão que nos leve a: 

Aceitar H 0 ou Rejeitar H 0 (em favor de H,) 

com base nos valores observados de X,, X 2 , ..., X M . 
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Usualmente, a escolha desse critério passa por eleger uma função l de X,, X,, .X 
chamada estatística de teste e dividir o conjunto dos valores possíveis de t(X, ,X,,. .. ,X ,,) 
em duas partes chamadas 

Região de Aceitação A 
e 

Região de Rejeição ou Região Crítica R 

Assim, conforme o valor de t, calculado a partir dos dados coletados, pertença a A ou 
pertença a R, aceita-se H 0 ou rejeita-se H 0 . 

Observação: A mesma formulação se aplica também ao caso discreto. Para isso basta 
substituirmos a função densidade f por uma função de probabilidade p. 

EXEMPLO 8.1: Propaganda enganosa? 

No caso da situação anterior, sobre a suspeita de propaganda enganosa, temos: 

• População: todos os cigarros da marca Delicious produzidos pela Companhia de 
Cigarros Tabacox. 

• Propriedade da população a ser analisada: teor de nicotina, representado pela v.a. X. 

• Função de densidade: podemos supor distribuição Normal. 

• Parâmetro: teor médio de nicotina dos cigarros Delicious, p (em mg) 

• Hipótese Nula: o teor médio de nicotina da marca Delicious é no máximo igual a 
0,7 mg. Simbolicamente, H 0 : p < 0,7. 

• Hipótese Alternativa: o teor médio de nicotina da marca Delicious é maior que 0,7 
mg. Simbolicamente, H,: p > 0,7. 

• Amostra aleatória X,, X 2 ,..., X n : teor de nicotina em cada cigarro dessa marca sele¬ 
cionado para análise 

Na Seção 8.3 veremos como estabelecer o critério para construir a estatística de teste 
t(Xj, X 2 , ..., X n ) e as regiões de aceitação (A) e de rejeição (R) da hipótese nula. 


Ao aplicarmos um teste de hipótese, cabe a nós tomar uma decisão com base em in¬ 
formação apenas parcial (a que está nos dados amostrais) sobre a realidade. Portanto, 
há dois tipos possíveis de erro de decisão que poderão vir a ser cometidos, e que seria 
conveniente evitar: 


Erro I - Rejeitar H 0 , quando H 0 é verdadeira 
Erro II - Aceitar H 0 , quando H 0 é falsa 

e cada um deles tem uma probabilidade de ocorrer: 

a = P [ Erro I ] = P[ Rejeitar H 0 ], se H 0 é verdadeira 

e 

p = P [ Erro II ] = P[ Aceitar H 0 ], se H ü é falsa 
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O problema pode ser resumido no seguinte quadro: 


Decisão 

Situação Real 

H 0 é verdadeira 

H 0 é falsa 

H 0 é aceita 

Decisão correta 

Erro tipo II 

H 0 é rejeitada 

Eito tipo 1 

Decisão correta 


8.2 ESCLARECENDO MELHOR ALGUNS CONCEITOS 

Antes de vermos como se estabelece o critério de decisão que define um procedimento de 
teste de hipótese, vamos tentar esclarecer os conceitos de hipótese nula, hipótese alterna¬ 
tiva, hipótese simples, hipótese composta, erro de decisão, probabilidades de erro etc. 

Como devemos especificar o que são H 0 e H,? 

É usual que na formulação de um teste de hipótese, no momento em que se define o que 
serão H 0 e H,, seja reservado para H 0 o papel da hipótese mais conservadora e para H, o 
papel da hipótese mais inovadora. Para explicar melhor esse ponto, consideremos no¬ 
vamente os quatro exemplos com os quais abrimos a exposição deste capítulo: 

• No caso da propaganda supostamente enganosa, consideremos que 0,7 mg de ni¬ 
cotina em um cigarro pode ser considerado um baixo teor e é o que o fabricante in¬ 
forma no rótulo da embalagem. Então, a hipótese nula H 0 : “O teor médio de nicoti¬ 
na para os cigarros Delicious é menor ou igual a 0,7 mg” pode ser entendida como 
“O teor de nicotina dos cigarros Delicious segue as especificações divulgadas pelo 
fabricante”. Já a hipótese alternativa Hp “O teor médio de nicotina dos cigarros 
Delicious é superior a 0,7 mg” pode ser entendida como “O teor de nicotina dos ci¬ 
garros Delicious não segue as especificações divulgadas pelo fabricante”. Aqui, H 0 
é a mais conservadora no sentido de que, se ela for verdadeira, não há nada a ser 
corrigido. Enquanto isso, H, seria a mais inovadora, no sentido de que, se ela for 
verdadeira, provavelmente se justificaria uma medida mais drástica, porque nesse 
caso estaria caracterizada uma propaganda enganosa. 

• No caso do debate televisado entre os dois candidatos a presidente, a hipótese nula 
H 0 seria “O debate não afetará as preferências do eleitorado”, e a hipótese alternati¬ 
va El, seria “O debate alterará as preferências do eleitorado”. É claro que H 0 é a 
mais conservadora, já que ela significa que tudo permanece inalterado, enquanto 
H, é a mais inovadora, porque implica mudança no cenário eleitoral. 

• No caso dos cinco tratamentos para a mesma doença, a hipótese nula H 0 (conservado¬ 
ra) seria “Os cinco tratamentos são igualmente eficazes”, ou seja, “Tanto faz usar o 
tratamento A ou B ou C ou D ou E, porque a chance de cura é a mesma em todos os ca¬ 
sos”. Já a hipótese alternativa H, (inovadora) seria “Há diferenças entre as eficácias 
dos cinco tratamentos”, ou seja, “As chances de cura não são as mesmas”, ou ainda, 
“Vale a pena abrir o olho quando seu médico lhe prescrever um desses tratamentos”. 

• No caso da relação entre tipo de atividade e estresse, a hipótese nula H 0 (conserva¬ 
dora) seria “O nível de estresse do trabalhador independe do tipo de atividade que 
ele exerce”, ou seja, “T odas as atividades são igualmente estressantes”. Já a hipóte- 
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se alternativa H, (inovadora) seria “Há uma relação de dependência entre o níve l 
de estresse do trabalhador e o tipo de atividade que ele exerce”, isto é, “Conforme 
o tipo de atividade a que o empregado for alocado, ele poderá se sentir mais ou me 
nos pressionado, estará mais ou menos exposto a ter um desequilíbrio nervoso 

O que são hipótese simples e hipótese composta? 

Dizemos que H 0 (ou H,) é uma hipótese simples se a ela corresponde um único valor 
do parâmetro 9. Nesse caso fica também definida de forma única a distribuição de pro¬ 
babilidade comum às v.a.'s X b X 2 ,..., X n . Caso contrário, trata-se de uma hipótese com¬ 
posta. Ou seja, a igualdade 9 = 0 O define uma hipótese simples, enquanto as 
desigualdades 9 < 0 O , 0 < 9 0 , 9 > 9 0 e 9 > 0 O definem hipóteses compostas. 

A hipótese nula H 0 vista como uma hipótese simples 

A hipótese H 0 sempre será tratada como uma hipótese simples. Já a hipótese alterna¬ 
tiva H, é, em geral, uma hipótese composta, ou seja, inclui mais de um valor de 0 e, con- 
seqüentemente, mais de uma distribuição de probabilidade (de fato, usualmente são 
infinitas distribuições de probabilidade). 

Em outras palavras, mesmo que as hipóteses sejam do tipo: 

H 0 : 0 < 9 0 vs. H,: 9 > 0 O ou H 0 : 0 > 0 O vs. H,: 0 < 9 0 

a hipótese nula será considerada como H 0 : 0 = 0 O , já que em ambas as situações 9 0 é o va¬ 
lor limite entre H 0 e Hj e, portanto, é o caso mais desfavorável a H 0 , além de especificar 
uma única distribuição de probabilidade. 

O significado dos erros de decisão em um teste de hipótese 

Quando alguém está começando a travar contato com o que seja um teste de hipóte¬ 
se, às vezes surge um questionamento do tipo: “Se H 0 é verdadeira, por que eu iria rejei¬ 
tá-la? E se H 0 é falsa, por que eu iria aceitá-la?” A resposta para isso é que tais erros 
podem ser realmente cometidos, simplesmente pelo fato de que a decisão é tomada com 
base em apenas um nível de informação parcial e incompleto sobre a população em es¬ 
tudo: aquele que está na amostra. E é justamente por não dispormos de informação to¬ 
tal e completa que podemos ser traídos pelos dados e levados a uma decisão incorreta, 
qual seja, cometer o Erro I ou o Erro II. 

Aqui está um exemplo caricatural que visa esclarecer melhor a metodologia dos tes¬ 
tes de hipótese: 

Em um programa de TV para crianças, o animador propõe um jogo. As crianças que par¬ 
ticipam do jogo devem comparecer ao palco acompanhadas de suas mães. Inicialmente, to¬ 
das as crianças têm os seus olhos vendados. Em seguida, as mães são organizadas 
aleatoriamente em uma fila indiana. Então, a primeira criança, de olhos vendados, vai per¬ 
correndo, uma por uma, a fila de mulheres até apontar aquela que ela julga ser a sua mãe. 
Para isso ela tem o direito de apalpar o rosto de cada uma daquelas mulheres. Depois vêm a 
segunda criança, a terceira etc. e todas elas passam também pelo mesmo processo. Aquelas 
crianças que apontarem corretamente quem é a sua mãe ganham um prêmio. 
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Pois bem, há uma analogia bem interessante entre esse jogo e um teste de hipótese. 

A situação é a da criança diante de uma mulher, tendo de decidir se esta é (H 0 ) ou não 
é (H,) a sua mãe. Os dados disponíveis para ela correspondem às suas sensações físicas 
(táteis) ao apalpar o rosto daquela mulher. Note que se trata de um nível de informação 
incompleto (principalmente por causa da venda nos olhos). Então, cometer o Erro 1 
neste caso seria dizer (com base na apalpação) que a mulher diante dela não é a sua mãe, 
se de fato for. Por outro lado, cometer o Erro II seria dizer (com base na apalpação) que 
a mulher diante dela é a sua mãe, se de fato ela não for. 

O que podemos dizer sobre as probabilidades de erro a e (3? 

Vimos que há dois tipos possíveis de erro de decisão: 

• o Erro 1, rejeitar H 0 quando ela é verdadeira, tem probabilidade a de ocorrer; 

• o Erro II, aceitar H 0 quando ela é falsa, tem probabilidade p de ocorrer. 

O ideal seria que ambas as probabilidades de erro, a e P, fossem tão pequenas quanto 
possível, mas infelizmente, se o tamanho n da amostra está fixado, uma diminuição de 
P traz como conseqüência um aumento em a e vice-versa. Por quê? Para diminuirmos 
a probabilidade do Erro II, teríamos de fazer com que a região de aceitação A diminuís¬ 
se. Conseqüentemente, a região de rejeição R aumentaria, o que inevitavelmente pro¬ 
vocaria um aumento na probabilidade do Erro I. Assim, a única forma de fazer com que 
ambos, a e p, diminuíssem, seria aumentar o tamanho n da amostra (ver Seção 8.6). 

O Erro I no centro das atenções 

Por definição, a é calculada supondo-se H 0 verdadeira, ou seja, a partir da distribuição 
de probabilidade única postulada por H 0 . Por outro lado, P é calculada supondo H, ver¬ 
dadeira. Então, em geral há infinitos valores possíveis para P , correspondentes a infini¬ 
tas distribuições de probabilidade. Assim, o cálculo de P é normalmente bem mais 
complexo que o de a. Levando em conta esse fato, os experimentadores tratam o Erro I 
como o mais importante a ser evitado, isto é, as hipóteses são formuladas de forma a que 
H 0 seja aquela hipótese cuja rejeição equivocada constitui o erro de maior importância. 

O que costuma ser feito normalmente é fixar-se um valor pequeno para a (digamos: 
0,05 ou 0,01) e, ao mesmo tempo, procurar usar procedimentos de teste para os quais 
os valores de P sejam os menores possíveis. 

A formulação adequada da hipótese H 0 vem a ser, nessas circunstâncias, vital na rea¬ 
lização de uma experiência. A questão é que o julgamento da importância de um erro de 
decisão pode ser bastante subjetivo. 

Consideremos, por exemplo, o caso da suposta propaganda enganosa. A hipótese 
H tal como foi formulada anteriormente, atende aos interesses do fabricante, dado que 
para ele o erro que mais interessa evitar é o de se concluir (erradamente) que o teor mé¬ 
dio de nicotina do seu produto é maior do que o afirmado por ele. Entretanto, do ponto 
de vista do consumidor, a situação pode ser diametralmente oposta. Com efeito, o erro 
que este quer minimizar e que se conclua que o teor médio de nicotina é menor que 
0,7 mg se de (ato ele for maior Assim, para o consumidor, a hipótese 11 0 deveria ser: “O 
teor médio de nicotina é maior ou igual a 0,7 mg . 
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Por tudo o que foi dito, neste livro a nossa atenção estará normalmente voliada para 
o Erro 1, e naturalmente admitiremos que a hipótese H 0 foi corretamente formulada 
Considerações sobre o Erro II serão feitas no Exemplo 8.2 a seguir e quando examinar 
mos com mais detalhe o conceito de poder de um teste de hipótese (ver Exemplo 8.7) 

EXEMPLO 8.2: Arqueologia - Os crânios encontrados são de que raça? 

Suponha que a longitude máxima de crânios humanos de uma certa raça A da anti¬ 
guidade pode ser encarada como uma variável aleatória com distribuição Normal de 
média 145 mm e desvio-padrão 12 mm. Por outro lado, para uma segunda raça B, a lon¬ 
gitude máxima dos crânios segue uma distribuição Normal com média 149 mm e o 
mesmo desvio-padrão de 12 mm. Admita agora que, em uma escavação, foram encon¬ 
trados 36 crânios e há dúvidas quanto à raça da população da qual eles são provenien¬ 
tes. Evidências adicionais encontradas nessa escavação mostram que os crânios só 
podem ser de uma das duas raças: A ou B. Os antropólogos consultados acreditam que a 
longitude máxima do crânio fornece uma boa medida para se especificar a raça. Como 
podemos decidir de que raça são os crânios? 

Uma hipótese será que p = 145 (raça A), enquanto a outra será que p = 149 (raça B), 
mas qual deve ser a hipótese nula e qual a alternativa? 

Suponha que, por razões históricas, sabe-se que o povo da raça A habitava na região 
onde foram encontrados os crânios. Logo, não seria surpreendente que fossem encon¬ 
trados crânios dessa raça na referida região. Por outro lado, suponha que se os crânios 
fossem da raça B isso representaria um achado de valor científico. Nesse caso, o erro a 
minimizar deve ser o de decidir pela raça B quando os crânios são de fato da raça A. Em 
outras palavras, devemos fazer com que a probabilidade a de se cometer esse erro tenha 
um valor pequeno. Portanto, a hipótese nula deverá ser p = 145 (conservadora) e a hi¬ 
pótese alternativa p = 149 (inovadora), ou seja: 

H 0 : p = 145 versus Hp p = 149 

Dizer que os crânios são da raça A equivale a dizer que suas longitudes máximas pro¬ 
vêm de uma Normal (145; 12 2 ). Já se eles são da raça B seus comprimentos máximos 
obedecem a uma Normal (149; 12 2 ). 

Como as hipóteses são relativas à média populacional, uma boa medida para se usar 
na decisão entre as duas populações é a média da amostra, que será, portanto, a nossa 
estatística de teste. 

Os 36 crânios encontrados podem ser considerados como uma amostra aleatória da 
população de raça A ou da população de raça B. Suponha que a média amostrai da longi¬ 
tude máxima, calculada com base nos 36 crânios encontrados foi X . = 147 3 mm. 

No presente exemplo, qual seria o critério de decisão a ser adotado se quisermos 
“amarrar” o valor de a em 0,05? 

Denotemos por x c o valor que serve como fronteira de decisão entre as regiões de 
aceitação A e de rejeição R. Esse ponto é usualmente chamado ponto de corte ou valor 
crítico. Então, aceitamos H 0 ,se X< x c ; e decidimos pela rejeição de H 0 (ou pela aceita¬ 
ção de H,), se X > x c . 
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Suponhamos que H 0 é verdadeira (ou seja, usemos a curva Normal com p = 145 e a = 

12) e calculemos, para essa curva, o valor crítico x r tal que P(X > x r ) = 0,05. 

x —145 x —145 

Padronizando, temos P (Z > — c — -) = 0,05, o que nos leva a L - -■- ?= - = 1 >64, ou 

12/V36 12/V36 

seja, x c = 148,28. Assim, o critério de decisão seria: 

Rejeitar H 0 , se X > 148,28. Caso contrário, aceitar H 0 . 



FIGURA 8.1 A origem dos crânios: regiões de aceitação e de rejeição, a e p. 

Como o valor obtido experimentalmente para X foi 147,3, inferior ao valor crítico 
x c = 148,28, decidimos pela não rejeição de H 0 . Concluímos então que não há evidên¬ 
cias suficientes para se afirmar que os crânios são da raça B, ao trabalharmos com uma 
probabilidade a do Erro I igual a 0,05. 

Neste exemplo é fácil calcular a probabilidade P do Erro 11. Para isso basta supormos 
que a hipótese verdadeira é H,: p = 149 e determinarmos a probabilidade de um valor da 
distribuição Normal com p = 149 e a = 12 cair à esquerda do valor crítico x c = 148,28. 
Temos então, 

p = P(X < x r ) = P(Z < 1 2 * ) = P(Z < -0,36) = 0,3594 ou 35,94% 

12/736 B 

Observação: A hipótese Hh desse exemplo está baseada em uma única distribuição de 
probabilidade, ou seja, é uma hipótese simples. Essa condição tornou fácil o cálculo do 
erro tipo II. Entretanto, esse não é o caso usual nos testes de hipóteses, já que geralmen- 
le H, é uma hipótese composta. 


8.3 ROTINA PARA OBTENÇÃO DO CRITÉRIO DE DECISÃO 

A forma usual de se propor um critério para testar a hipótese nula H 0 contra a hipótese 
alternativa H, pode ser descrita pela seguinte seqüência de passos: 

1 Especificar H 0 e H,, onde H 0 deverá conter sempre a igualdade (ou seja, deve 
conter o valor do parâmetro 0 que está exatamente na fronteira entre as re¬ 
giões correspondentes a 11„ e a II,). 

2 Escolher um valor para a = P | Erro 1 1, também chamado nível de significân- 
cia do teste (usualmente escolhe-se a igual a 0,01 ou 0,05). 
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3. Eleger a estatística de teste t(X,, X 2 ,X n ), uma variável aleatóriaquc depen 
de de X,, X 2 ,X n e que, supostamente, “resume toda a informação relevan 
te” para que se decida por H 0 ou por H,. 

4. Determinar a distribuição de probabilidade de l correspondente a H, lem 
brando que H 0 será sempre considerada como uma hipótese simples. 

5. Especificar a região de rejeição R, ou seja, o conjunto de valores de l que nos le¬ 
varão a rejeitar H 0 , de tal forma a que o nível de significância do teste seja igual ao 
a escolhido no segundo passo e trabalhando com a distribuição de t determinada 
no quarto passo. Automaticamente estará também especificada a região de acei¬ 
tação A, complementar de R dentro do conjunto dos valores possíveis de t. 

6. Coletar os dados x l5 x 2 ,x n , calcular valor de t (x,, x 2 ,..., x n ) e decidir pela rejei¬ 
ção ou pela aceitação de H 0 , conforme o critério especificado no quinto passo. 

Observação: Recomenda-se que a coleta da amostra só seja feita no último passo, para 
que o pesquisador não se sinta tentado a fazer escolhas intermediárias, influenciado por 
um conhecimento prematuro dos dados, comprometendo assim a postura de neutrali¬ 
dade que dele se espera. 

Esclarecimento: 

Há mais dois conceitos de caráter geral que fazem parte da teoria dos Testes de Hipó¬ 
tese: nível crítico (ou p-valor) e poder do teste. Estes conceitos serão apresentados 
nas Seções 8.5 e 8.6, respectivamente. Entretanto, para facilitar a exposição, opta¬ 
mos por apresentar primeiramente um tipo específico de teste de hipótese, a saber, o 
teste para a média populacional. Assim, embora o nível crítico e o poder do teste se¬ 
jam conceitos que se aplicam a qualquer tipo de teste de hipótese, eles foram intro¬ 
duzidos no contexto particular do teste para a média populacional. 


8.4 TESTE PARA A MÉDIA POPULACIONAL 

Quando o parâmetro envolvido no teste é a média populacional p da variável de interesse, 
então na construção do critério de decisão será usada a média amostrai X, como no exem¬ 
plo anterior. Suponha que a distribuição original dos dados seja Normal, ou que n seja su¬ 
ficientemente grande de forma a que a distribuição de X se aproxime da Normal (TCL). 

Seja p 0 uma constante conhecida. O roteiro para se construir um teste de hipótese 
para p, quando a é conhecido, é o seguinte: 

1. Especificar H 0 e H, usando uma dentre estas três possibilidades: 

H 0 :p = p 0 vs Hp p ^ Po (teste bilateral) ou 

H 0 : p < Po vs H,: p > p 0 (teste unilateral) ou 

H 0 : p > Po vs Hp p < Po (teste unilateral). 

Nos dois testes unilaterais, trabalharemos como se a hipótese nula fosse 

H 0 : p = Po, que é o valor extremo das respectivas desigualdades 
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2. Escolher o nível de significância a, em geral igual a 0,01 ou 0,05. 

3. Usar como estatística de teste a expressão Z = —— pV cu j a distribuição de pro¬ 
babilidade correspondente a H 0 é N(0;1). ° ^ n 

4. Obter a região de rejeição R (ou seja, o conjunto de valores de Z que nos levarão 
a rejeitar H 0 ), levando em conta: 

a) A especificação das hipóteses feita no primeiro passo. 

b) O nível de significância a escolhido no segundo passo. 

c) O fato de que sob H 0 a distribuição de Z é N(0; 1), como vimos no terceiro 
passo. 

5. Coletar os dados x,, x 2 ,..., x n , calcular valor de Z = — p - e decidir pela rejeição 

a/V n 

ou pela aceitação de H 0 , conforme o critério especificado no quarto passo. 

A seguir estão os gráficos e as respectivas regiões de rejeição para cada uma das três 
possibilidades mencionadas no primeiro passo. 

H 0 :h=Mo vsH,:h*^ H 0 : \i < ji 0 vsH,:n>n 0 H 0 : n 2 n 0 vs H,: m <m 0 





Região de Rejeição: 

Z < za_ ou Z > z,_ a_ 
2 2 


Região de Rejeição: 
^ > z i-a 


Região de Rejeição: 
Z<z„ 


FIGURA 8.2 Teste da média - regiões de rejeição e de aceitação. 


Observe que, no caso de teste bilateral, a região de rejeição corresponde às duas cau¬ 
das simétricas da Normal padrão, ambas de área a/2. Já no caso de teste unilateral, a re¬ 
gião de rejeição corresponde a uma única cauda de área a da Normal padrão, ora à 
direita, ora à esquerda. 

É claro que a regra de decisão, em vez de ser formulada em termos da variável Z, tam¬ 
bém pode ser expressa em termos de X. Por exemplo, se as hipóteses forem H 0 : p > p 0 vs. 

H,: p < p 0 , então H 0 deve ser rejeitada se Z = ——p- < z a , condição essa que é equivalente 

a/V n 


a X < p 0 Z]„ a 



(Observe que z a = - z 1 _ ot .) 


PERGUNTA: Como fica essa equivalência para as duas outras opções de hipóteses? 


EXEMPLO 8.3: Propaganda enganosa (cont.) 

Construir o leste de hipóteses para o exemplo do teor médio de nicotina em cigarros 
da Companhia Tabacox, supondo que o desvio-padrão populacional do teor de nicoti¬ 
na seja conhecido e igual a 0,04 mg. 

1. As hipóteses H„ e H, já foram especificadas no Exemplo 8.1: 

H 0 : p < 0,7 e H, : p > 0,7 
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2. Fixaremos o nível de significância em a = 0,05. 

3. Como |a 0 = 0,7, a = 0,04 e n = 16, a eslatística de teste apropriada é 

z _ X-0,7 __ X - 0,7 
0,04/VÍ6 0,01 

No Exemplo 8.1 foi feita a suposição de que o teor de nicotina tem distribui¬ 
ção Normal. Portanto, sob H 0 , Z tem distribuição N(0; 1). 

4. Para especificar a região de rejeição R do teste, inicialmente observemos que, 
quanto maior for a média amostrai X (e consequentemente o valor de Z), maio¬ 
res serão as razões para se rejeitar H 0 . Seguindo o passo 4 do roteiro anterior, re¬ 
jeitaremos H 0 se Z > z^, onde a=0,05. Consultando a tabela da Normal ou um 
software adequado, temos que Z 0,95 —1)64. 

Concluindo: 

Região de rejeição R: Z > 1,64, ou equivalentemente, X > 0,7164; 

Região de aceitação A: Z < 1,64, ou equivalentemente, X < 0,7164. 



FIGURA 8.3 Propaganda enganosa - rejeição ou aceitação? 


5. Digamos que os valores de teor de nicotina dos 16 cigarros integrantes da amos¬ 
tra coletada pelo organismo fiscalizador são: 

0,718 0,703 0,692 0,792 0,657 0,679 0,706 0,719 

0,673 0,682 0,665 0,684 0,770 0,761 0,699 0,728 

Com esses valores obtêm-se X . = 0,708 e Z obs = = o,8. 

0,01 

Logo, estamos na região de aceitação A, e a decisão a ser tomada é aceitar a hipótese 
H 0 de que o teor de nicotina médio é no máximo igual a 0,7, ao nível de significância de 
5%. Portanto, não há indícios de que a afirmação da Tabacox em sua propaganda estaria 
incorreta. ■ 

E se ct for desconhecido? 

Em situações semelhantes à do exemplo anterior, se o desvio-padrão populacional 
não fosse conhecido, uma alternativa possível seria trabalharmos com o desvio-padrão 
amostrai (estimado a partir dos dados) em seu lugar. Nesse caso, o preço a ser pago é 
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que a estatística de teste teria uma distribuição t de Student com (n - 1) graus de liber¬ 
dade sob H 0 , analogamente ao que ocorreu na discussão do capítulo anterior sobre 
Intervalo de Confiança. 


EXEMPLO 8.4: Propaganda enganosa, supondo a desconhecido 

Conforme o comentário anterior, vamos substituir o desvio-padrão populacional a 
pelo desvio-padrão amostrai S e repetir os passos de 3 a 5. 


X — 0 7 

Passo 3: A estatística de teste será T =-— 

s/Vií 

dent com n - 1 = 15 graus de liberdade. 


, cuja distribuição sob H 0 é uma t de Stu- 


Passo 4: A região de rejeição será T > t,_ a . Para n -1 = 15 g.l. e a=0,05, consultando a tabe¬ 
la da distribuição t ou usando um software apropriado, temos = 1,753. Portanto: 

— S 

Região de rejeição R: T >1,753, ou equivalentemente, X > 0,7 + 1,753 x —; 

4 

Região de aceitação A: T < 1,753, ou equivalentemente, X < 0,7 + 1,753 x —. 

4 


Passo 5: Considerando a mesma amostra do Exemplo 8.3, temos X nbs = 0,708 e 

0,708-0,7 


S obs = 0,0387. Logo, t obs = 


= 0,827. Portanto, estamos na região de aceitação 


(0,0387 )/4 

A. A decisão a ser tomada continua sendo: aceitar a hipótese nula de que o teor de nico¬ 
tina médio é no máximo igual a 0,7, ao nível de significância de 5%. ■ 


8.5 O CONCEITO DE NÍVEL CRÍTICO 

Vamos agora definir o conceito de nível crítico ou valor-p associado a uma certa meto¬ 
dologia de Teste de Hipótese e a uma determinada amostra x,, x 2 ,..., x n (onde x, é o valor 
assumido pela variável aleatória X,no experimento da coleta de dados, i = 1,2,..., n): 


O nível crítico ou p-valor é o menor valor de a (nível de significância do teste) 
para o qual, ao usar essa metodologia (ou seja, esse procedimento de teste) e tra¬ 
balhar com os valores observados X|, x 2 , ...,x n , ainda rejeitaríamos Ho. O nível crí¬ 
tico costuma ser representado pelo símbolo â. 


Comentários sobre o nível crítico: 

Embora essa definição seja razoavelmente simples, o conceito de nível crítico é, ao 
mesmo tempo: 

• um dos mais importantes, por ser muito usado nas publicações científicas, quan¬ 
do se trata de reportar os resultados de um teste de hipótese; 

• um dos mais sutis, uma vez que normalmenle é necessário algum tempo de ama¬ 
durecimento e de familiarização com esse assunto para que alcancemos uma com¬ 
preensão mais clara do seu significado. 
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EXEMPLO 8.5: Tempo médio de vida das pessoas 

Deseja-se testar a hipótese nula H 0 de que em média os habitantes de uma certa loca¬ 
lidade L vivem pelo menos 80 anos contra a alternativa H, de que eles vivem em média 
menos de 80 anos. Com base em levantamentos realizados em anos anteriores, sabe-se 
que nessa localidade o tempo de vida das pessoas se comporta segundo uma curva Nor¬ 
mal com desvio-padrão populacional de aproximadamente 20 anos. Foi extraída uma 
amostra com 16 casos dos registros de óbitos da localidade, ao longo do último ano, e 
foram registrados os tempos de vida em anos de cada um desses 16 indivíduos. A média 
amostrai foi de 70 anos. 

a) Qual seria a sua conclusão, ao nível de significância de 5%? 

b) Qual o nível crítico? 

Solução: 

A questão básica a ser respondida aqui é: será que, mesmo que se viva em média pelo 
menos 80 anos nessa localidade, a chance de se obter, com uma amostra de 16 pessoas, 
uma média amostrai de 70 anos ou menos (como de fato aconteceu) não pode ser razoa¬ 
velmente grande? Se, ao contrário, ela for bem pequena, teremos evidências suficientes 
de que H 0 é falsa, e, portanto, deve ser rejeitada. 

Temos então uma amostra aleatória X h X 2 ,..., X n , de tamanho n = 16 , onde X, é Nor¬ 
mal (p, a 2 ), para todo i e sabemos que a = 20. Como o desvio-padrão populacional é co¬ 
nhecido, a distribuição de probabilidade da estatística de teste sob H 0 será uma Normal. 

a) Vamos seguir os passos da rotina recomendada: 

1. As hipóteses nula e alternativa podem ser expressas como: 

H 0 : p > 80 H,: p < 80 

2. Escolher a = 0,05. 

3. Segundo o roteiro, a estatística de teste aqui deveria ser Z = ——^J-, cuja distribui- 

a/Vn 

ção sob H 0 é uma Normal padrão. No entanto, como Z e X estão ligados através 
dessa relação, também podemos usar X como estatística de teste. Isso é então o 
que será feito neste exemplo. 

4. Para especificar a região de rejeição R do teste, inicialmente observemos que 
quanto menor for a média amostrai X, maiores serão as razões para se rejeitar H 0 . 
Então, um critério de decisão razoável seria: 

Rejeitar H 0 , se X < B, onde B é uma constante a ser especificada. 

Caso contrário, aceitar H 0 . 

Qual deve ser o valor do ponto de corte B? 

Ele deve ser escolhido de tal maneira a que seja respeitada a escolha de a = 5%, 
que foi feita no primeiro passo. 

Devemos ter, então: 

0,05 = a = P(Erro I) = P(Rejeitar H 0 ), quando H 0 é verdadeira 
Logo, 0,05 = P(X < B), sendo X ~ N(80; 5 2 ), conforme o resultado do terceiro 
passo. 
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FIGURA 8.4 Tempo de vida - rejeição ou aceitação? 


Padronizando, temos: 0,05 = P 
B -80 


X -80 B -80 

- < - 


\ 

1 

CO 

1 

00 

o 

= p 

z<- 

) 

1 5 J 


ca que 


5 5 

= -1,64, ou seja, B = 80 - 1,64 x 5 = 71,80. 


, o que impli- 


Concluindo: Rejeitar H ( , se: X < 71,80; Aceitar H 0 se: X > 71,80. 


5. Uma vez coletados os dados, obtivemos X obs = 70. 

Logo, o “valor observado” de X está na região de rejeição R . 

A decisão a ser tomada é então rejeitar a hipótese H 0 de que nessa localidade 
as pessoas vivem em média pelo menos 80 anos. 


b) Cálculo do nível crítico: 

Usando a = 0,05, vimos que H 0 foi rejeitada com base na amostra coletada. 

E se tivéssemos usado a = 0,01 , qual seria a nossa decisão? 

Reproduzindo o raciocínio anterior, vemos que o novo ponto de corte seria então 
B = 80 - 2,33 x 5 = 68,35. Ou seja, neste caso, teríamos: 


Região de rejeição R: X < 68,35; Região de aceitação A: X > 68,35. 


Como X obs = 70 > 68,35, vemos que ao nível de significância a = 0,01, a decisão indica¬ 
da seria aceitar H 0 . 

Então, se formos reduzindo progressivamente o valor de a desde 0,05 até 0,01, vai 
existir um ponto em que a nossa decisão passa de rejeição para aceitação. Esse é o ní¬ 
vel crítico â associado à nossa amostra. Resolvendo então o problema “de trás para a 
frente”, fixaremos o ponto de corte igual ao valor da média amostrai 70 e calculare¬ 
mos â, tal que: 

â = P[X< 70], sendo X ~ N(80;5), ou seja, 


â =P 


Z< 


70-80 


= P[Z< -2,0] = 0,023 


Portanto, o p-valor ou nível crítico do teste é 0,023 ou 2,3%. 

A figura a seguir é uma tentativa de esclarecer melhor o conceito de nível crítico nes¬ 
te exemplo, através de um zoom na cauda da esquerda da densidade de X sob H 0 . 
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Suponhamos agora que numa outra localidade L’ tenha sido feito o mesmo teste das 
hipóteses H 0 : p. > 80 vs. H,: p. < 80, obtendo-se um nível crítico igual 0,0001. Nesse 
caso, a decisão em L’ também será rejeitar a hipótese H 0 de que as pessoas vivem em mé¬ 
dia pelo menos 80 anos nessa localidade. Entretanto, a decisão de rejeitar H 0 será feita 
com maior segurança em L’ do que na primeira localidade L. ■ 

EXEMPLO 8.6: Novamente a questão da raça de onde provêm os crânios 

Como vimos anteriormente, a probabilidade a do Erro I é também conhecida como 
nível de significância do teste. Por isso, no exemplo sobre a origem dos crânios, pode¬ 
mos dizer que o teste não foi significativo, na medida em que a média amostrai não caiu 
na região crítica, isto é, na região de rejeição de H 0 determinada a partir do nível a. 

Aqui o nível crítico â é calculado como a probabilidade de que X seja maior do que a 
média amostrai obtida experimentalmente, ou seja, 147,3, supondo que a hipótese nula 
é verdadeira. Então, 

— 147 3 — 145 

â = P (X > 147,3) = P (Z > ' t _ ) = P (Z > 1,15) = 0,1251 

12/736 

Isto é, para rejeitarmos H 0 com os dados disponíveis teríamos de usar um nível de 
significância de pelo menos 12,51%. Como não desejamos que a probabilidade do Erro 
I seja assim tão grande, a decisão correta seria a não rejeição da hipótese nula. ■ 


8.6 O PODER DO TESTE 

Já vimos que quando testamos uma hipótese nula H 0 contra uma hipótese alternativaH[ 
há duas possibilidades: aceitar H 0 ou rejeitar H 0 . Pode-se dizer que a decisão de rejeitar 
H 0 é uma conclusão “forte” porque, se H a for verdadeira, essa decisão é tomada com 
uma probabilidade de erro a pequena e controlada pelo experimentador. Contudo, de- 
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cidir aceitar H 0 é uma conclusão “fraca”, porque depende da probabilidade P de Erro II, 
que não é controlada pelo experimentador. Consideremos o caso de um teste unilateral 
do tipo encontrado no exemplo da propaganda enganosa, isto é, do tipo H 0 : p< p 0 con¬ 
tra a alternativa H,: p > p 0 . Pode ocorrer que o verdadeiro valor da média populacional 
seja um valor p l5 desconhecido e maior que p 0 , sendo a hipótese nula, portanto, falsa. 
Entretanto, se p, estiver próximo de p 0 , o teste não terá condições de distinguir entre os 
dois valores (ver exemplo a seguir) e, para um nível de significância a dado, H 0 será ace¬ 
ito com uma probabilidade P grande, de Erro II. Por isso, em vez de dizer que aceitamos 
H 0 , preferimos dizer que não rejeitamos H 0 ou que os dados não produzem uma evidên¬ 
cia suficiente para rejeitar H 0 . 

Uma maneira de avaliar a capacidade do teste de detectar uma diferença entre o valor 
Po postulado pela hipótese nula e um outro valor p, é testar a hipótese simples H 0 : p = p 0 
contra a alternativa H,: p = p, (semelhantemente ao que foi feito no exemplo dos crânios). 
Em seguida, dado a e uma vez obtido o valor crítico x c , calcula-se P, a probabilidade do 
Erro II, que seria cometido se aceitássemos a hipótese nula H 0 : p =p 0 no caso de a hipó¬ 
tese Hp p = p, ser a hipótese verdadeira. Para um dado a, quanto menor for P, ou quanto 
maior for 1 - P, maior força terá a rejeição da hipótese nula quando ela é falsa. Por esse 
motivo, a quantidade EI = 1 — P é chamada de poder do teste. 

O poder de um teste estatístico é a capacidade de o teste rejeitar corretamente 

uma hipótese nula falsa, ou seja, a probabilidade de rejeitar a hipótese nula quan¬ 
do a hipótese alternativa for verdadeira. 

No Exemplo 8.3, a Companhia de Cigarros Tabacox foi inocentada da acusação de 
propaganda enganosa porque o teor de nicotina médio da amostra, X obs = 0,708 mg, 
está dentro da região de aceitação da hipótese nula, H 0 : p < 0,7. Ou seja, foi aceito que o 
teor médio de nicotina dos cigarros não é maior do que 0,7 mg. E se o verdadeiro valor 
médio fosse de 0,71 mg? Nesse caso a afirmação da propaganda seria falsa, porém, com 
os dados da amostra analisada, não teríamos como comprová-lo. Ou seja, a aceitação de 
H 0 , e portanto a não condenação da Tabacox, é mais uma conseqüência da insuficiência 
de provas do que da veracidade do afirmado pela propaganda. 

EXEMPLO 8.7: Novamente a propaganda enganosa 

Determinemos o poder do teste para rejeitar corretamente a hipótese nula H 0 :p = 0,7 
quando o verdadeiro conteúdo médio de nicotina dos cigarros é p = 0,71. 

Em nosso caso, p = P(aceitar H 0 : p = 0,7), quando de fato p = 0,71. Lembrando que 
para a = 0,05 encontramos o valor crítico x c = 0,7164 mg, teremos: 

p = P (X < 0,7164 ) quando p = 0,71 , ou seja, 

H .p(Z< °.7! 64-071 ) „ p (z < o 64) = o 73 8 9 
(0,04 )/v L6 

Portanto, poder do teste = fl = 1 - P = 0,261 1 ou 26,11%. 
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Isso significa que, se o verdadeiro valor médio e de 0,71 mg de nicotina, hipótese 
H 0 : p = 0,7 será corretamente rejeitada e, portanto, a diferença entre os valores 0,7 e 
0,71 será detectada em apenas 26% das vezes. 

Vejamos agora o que ocorre se o verdadeiro valor do conteúdo médio de nicotina 
fosse 0,72. Devemos testar H 0 : p = 0,7 contra H,: p = 0,72. Agora, 

(3 = P (X < 0,7164 ) quando p = 0,72 , ou seja, 

P = P (Z < 0,7164 ~^L 2 ) = P ( Z < -0,36) = 0,3594 
(0,04 )/ Vl6 

Então, Poder do teste = II = 1 - P = 0,6406 ou 64,06%. 

Isso quer dizer que, se o verdadeiro valor médio é de 0,72 mg de nicotina, a hipótese 
H 0 : p = 0,7 será corretamente rejeitada - e portanto, a diferença entre os valores 0,7 e 
0,72 será detectada - em 64 % das vezes. 

Vemos assim que, para uma mesma probabilidade de Erro I, à medida que o valor 
verdadeiro do teor médio de nicotina se afasta do valor postulado pela hipótese nula, o 
poder do teste aumenta. 

Neste exemplo só consideramos valores alternativos superiores a 0,7 porque o teste 
principal é unilateral, sendo os valores de p favoráveis a Hj maiores que 0,7. 

Convém observarmos que o poder do teste também depende do tamanho da amostra. 
Suponhamos que os valores são x obs = 0,708 mg, a = 0,04 e a = 0,05 como anterior¬ 
mente, mas admitamos que n = 144 em vez de 16. Então, para testar H 0 : p = 0,7 encontra¬ 
mos um valor crítico x c = 0,7 + 1,64 x-^£lr = 0,7055. Como agora x ob >x c , rejeitamos 

V144 

a hipótese nula. O poder do teste, no caso em que o verdadeiro valor é p = 0,71, é agora 

n=l-P=l-P(Z< 0,7054 = 1 - P(Z<-1,38) = 1 - 0,0838 = 0,9162 ou91,62% 

(0,04 )/Vl44 

Ou seja, dadas as mesmas condições, o poder do teste aumenta com o tamanho da 
amostra. 

No exemplo da propaganda enganosa, o advogado da Tabacox não pode ser acusado 
de manipular os dados para favorecer o seu cliente, porque ele e o organismo fiscaliza- 
dor usaram exatamente a mesma informação, ou seja, os mesmos dados. Contudo, é 
claro que ele se aproveitou do fato de o tamanho da amostra, 16, ser insuficiente para 
que o teste tivesse um poder mais alto. Seguramente, se o verdadeiro valor de p fosse 
0,71 mg de nicotina, isso seria detectado com uma amostra contendo um número maior 
de cigarros analisados e, assim, a Tabacox teria sido condenada. ■ 

8.7 TESTE PARA PROPORÇÕES 

Seja p a proporção populacional (desconhecida) dos elementos de uma população que 
possuem um determinado atributo. Queremos testar hipóteses sobre os valores possí¬ 
veis do parâmetro p a partir da realização de um experimento em que sera sorteada uma 
amostra aleatória com n elementos dessa população. 
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Se X é o numero de elementos da amostra que possuem esse atributo, a proporção 
amostrai p = X/n será a nossa estatística de teste. A variável aleatória X se comporta 
segundo uma lei Binomial (n;p), e a distribuição de p pode ser aproximada por uma 


Normal (p; 


P(l-P) ) 


, se n for suficientemente grande. 


n 


Seja p 0 um determinado número entre 0 e 1. Então p 0 e o 0 = ^| p°^ P l2 S ão, res¬ 
pectivamente, a média e o desvio-padrão de p, quando p = p 0 . (Conforme as considera¬ 
ções feitas na Seção 6.2 quanto à viabilidade de se aproximar a Binomial por uma 
Normal, suporemos aqui que np 0 ( 1 — p 0 ) > 3). Temos três possibilidades a considerar: 


H 0 : p - po vs H |: p * p 0 

Região de Rejeição: 

P > PO z l-a/2 ■ CT 0 OU 
p < PO - Zi.q/2- CTq . 


H 0 :p<p 0 vs Hp p > po 

Região de Rejeição: 

P > Po + Z|-a- o 0 


H 0 :p>p 0 vs H,:p<p 0 

Região de Rejeição: 
p < Po - Z|. a . a 0 


Em cada uma das figuras a seguir, procuramos apresentar dois gráficos: o primeiro 
mostra o que ocorre no espaço do parâmetro p (não observável), e o segundo mostra o 
que ocorre com a estatística de teste p (observável). 


Hipóteses nula e alternativa Regiões de aceitação (A) e de rejeição (R) 

em termos do parâmetro p em termos da estatística de teste p 



FIGURA 8.6 Teste bilateral de proporção - H 0 : p - p 0 contra Hp * p 0 


Hipóteses nula e alternativa Regiões de aceitação (A) e de rejeição (R) 

em termos do parâmetro p em termos da estatística de teste p 



FIGURA 8.7 Teste unilateral de proporção - H 0 : p < p 0 contra Hp > p 0 . 
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Hipóteses nula e alternativa Regiões de aceitação (A) e de rejeição (R) 

em termos do parâmetro p em termos da estatística de teste p 



FIGURA 8.8 Teste unilateral de proporção - H 0 : p > p 0 contra Hp < p 0 . 


Justificativa teórica para o procedimento: 

O leitor interessado em entender a justificativa teórica para esses procedimentos po¬ 
derá verificar que eles decorrem automaticamente de se aplicar a “Rotina para obten¬ 
ção do critério de decisão”, apresentada na Seção 8.3, ao caso específico do teste de 
proporção. 


EXEMPLO 8.8 Psicólogos atuando na área de clínica 

Queremos testar a hipótese nula de que a proporção p de psicólogos atuando na área 
de clínica é menor ou igual a 60% contra a alternativa de que ela é superior a 60%, em 
uma certa cidade. Vamos trabalhar com uma amostra aleatória de n = 80 psicólogos se¬ 
lecionados ao acaso nessa cidade. Suponhamos que, como resultado do experimento, 
verificou-se que 61 entre os 80 psicólogos sorteados atuam em clínica. 

Qual a decisão a ser tomada, ao nível de significância de 0,01? 


Solução: 

Temos neste caso: 


H 0 : p < 0,60 vs. H^p > 0,60 
Po = 0,6 e ct 0 = 


0,6 x 0,4 


80 


0,0548. 


Vemos que se trata de um teste unilateral. Além disso, Z 099 = 2,33. 

Então, H 0 deve ser rejeitada, se p obs > 0,6 + 2,33 x 0,0548 = 0,728. 

Como p obs = 61/80 = 0,763, H 0 é rejeitada. 

Isso significa que, com base nos dados, há fortes evidências de que a proporção de 
psicólogos atuando em clínica nessa cidade é superior a 60%. 


Pergunta: 

Qual o nível crítico neste caso? 
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Condições para aplicabilidade do teste de proporções: 

Os procedimentos de teste, nos moldes em que eles foram aqui apresentados, se 
aplicam somente ao caso em que o tamanho n da amostra é suficientemente gran¬ 
de para que a aproximação da Binomial pela Normal já esteja dentro de um nível 
de precisão adequado. Se n não é suficientemente grande para que se possa usar a 
aproximação pela Normal (por exemplo, se n < 20), devemos trabalhar com a 
própria Binomial, (veja, por exemplo, o Exercício Proposto 8.11_P). 


8.8 TESTES PARA COMPARAÇÃO DE DUAS MÉDIAS 

Temos basicamente duas categorias de problemas que se enquadram nessa situação: os 
testes pareados e os não-pareados. O planejamento do experimento é diferente nas duas 
categorias. No caso dos testes não-pareados, temos duas populações distintas e uma de¬ 
terminada característica - uma variável quantitativa - de modo que a cada elemento de 
ambas as populações pode ser associado o valor dessa variável que lhe corresponde. Já 
para os testes pareados, os dados são fornecidos aos pares, e a idéia é comparar direta¬ 
mente, entre si, os dois elementos de cada par. 


8.8.1 Teste t para amostras não-pareadas 

Aqui temos duas populações distintas e uma determinada característica, que será deno¬ 
tada por X em uma população e por Y na outra. Queremos comparar as médias popula¬ 
cionais de X e de Y. Para isso são coletadas amostras, uma em cada população, e, para 
cada elemento dessas amostras, mede-se o valor da característica considerada. 

Matematicamente, temos então m variáveis aleatórias X,, X 2 ,..., X m iid, que serão ad¬ 
mitidas Normais com média populacional p x e desvio-padrão populacional a x en va¬ 
riáveis aleatórias Y,, Y 2 ,..., Y n iid que serão admitidas Normais com média populacional 
p Y e desvio-padrão populacional a Y . 

Admite-se também que há independência entre os X-s e os Yj’s. 

Queremos testar a hipótese nula de médias populacionais iguais contra a alternativa 

de médias populacionais diferentes, isto é, H 0 : p x - p Y = 0 contra H,: p x - p Y * 0. 

Admitiremos válida também a premissa de que os desvios-padrão populacionais g x 
e ct y são iguais, isto é, g x = o Y = g, embora o seu valor o seja desconhecido. 

A estatística de teste a ser usada é 


T = 


X-Y 


(i n 

—+— 

Ira n ) 


em que: 

X é a média amostrai dos X,’s, i = 1,..., m 
Y e a média amostrai dos Yj’s, j = 1,..., n 
é a variância amostrai dos X,’s, i = 1,... 

S: é a variância amostrai dos Y^s, j = 1,..., 

ç- í|n i ói I )S Y () es ij ma d or combinado de g 2 . 

p m+n-2 


m 

n 
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(ou seja, Sp é uma expressão matemática em que todos os m + n dados são usados u 

multaneamente para se obter uma estimativa única de a 2 ). 

Prova-se que, se H 0 é verdadeira, a variável aleatória T segue uma distribuição t de 
Student com m+n-2 graus de liberdade. Assim, uma vez escolhido o nível de significân 
cia a, rejeita-se H 0 se |T obs | > t . 

í-- 

2 

Observações: 

1- Quando a hipótese alternativa é do tipo H,: p x - p Y * 0 como anteriormente, 
diz-se que o teste é bilateral. Caso a alternativa fosse do tipo H,: p x - |i Y > 0, o cri¬ 
tério de decisão seria rejeitar H 0 se T obs > t,. a . Teríamos então um teste unilateral. 
(E se Hp p x - p Y < 0, qual seria o critério?) 

2. Em todas as situações aqui consideradas, o número de graus de liberdade é m+n-2. 

3. Para mais detalhes sobre a distribuição t de Student, ver Subseção 7.7.2. 


Condições para a aplicabilidade do teste t não-pareado: 

Basicamente, duas condições devem ser atendidas para que se possa aplicar o tes¬ 
te t a fim de comparar médias com duas amostras não-pareadas: 

a) As variâncias populacionais da variável considerada nas duas populações 
devem ser iguais; 

b) A distribuição da variável deve ser Normal em ambas as populações. 

A condição (a) é bem mais crítica do que a condição (b). Esta perde muito da sua 
importância quando os tamanhos amostrais são grandes. 


EXEMPLO 8.9 Comparando os setores de comércio e serviços em termos de 

nível salarial 

Os dados deste problema vêm da Tabela 8.1, que contém informações relativas às 
micro e pequenas empresas atuando no Brasil nos setores de comércio e serviços: pes¬ 
soal ocupado, salários, segundo as diversas atividades no ano de 2001. 

Os dados foram divididos em dois grupos: 

Grupo A: Atividades ligadas a comércio 
Grupo B: Atividades ligadas a serviços 

Nosso objetivo é comparar os dois grupos de atividades quanto ao nível salarial mé¬ 
dio dos seus empregados, expresso em termos das variáveis X = log (salário per capita 
no setor do comércio) e Y = log (salário per capita no setor de serviços). 

a) Por que a proposta deste exemplo é trabalharmos com a variável 
log(salário p.c.) e não com o próprio salário per capita (p.c.)? 

b) Teste a hipótese nula de que não há diferença entre as médias da variável 
log(salário p.c.) nesses dois grupos contra a alternativa de médias diferentes, ao 
nível de significância de 1%. 

c) Qual o nível crítico? 

Explicite claramente a metodologia utilizada e as conclusões obtidas. 
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TABELA 8.1 Micro e pequenas empresas de comércio e serviços, pessoal ocupado, salários, 
salário per capita e log(salário per capita), segundo as atividades - 2001 


Atividade 

Pessoal 

Salários 
(mil reais) 

Salário 
per capita 

Log(Salário 
per capita) 

Setor 

1 

271.502 

985.090 

3,628 

1,289 

COM 

2 

77.075 

370.142 

4,802 

1,569 

COM 

3 

20.858 

72.798 

3,490 

1,250 

COM 

4 

1 19.879 

459.750 

3,835 

1,344 

COM 

5 

89.190 

382.397 

4,287 

1,456 

COM 

6 

86.126 

442.373 

5,136 

1,636 

COM 

7 

50.043 

241.332 

4,822 

1,573 

COM 

8 

21.531 

1 19.354 

5,543 

1,713 

COM 

9 

559.137 

1.383.463 

2,474 

0,906 

COM 

10 

534.656 

1.318.461 

2,466 

0,903 

COM 

1 1 

24.481 

65.002 

2,655 

0,977 

COM 

12 

2.673.601 

9.059.619 

3,389 

1,220 

COM 

13 

478.238 

1.44 l.l 25 

3,013 

1,103 

COM 

14 

61 1.212 

1.780.162 

2,913 

1,069 

COM 

15 

274.780 

995.719 

3,624 

1,287 

COM 

16 

89.442 

366.307 

4,095 

1,410 

COM 

17 

140.436 

626.894 

4,464 

1,496 

COM 

18 

418.282 

1.551.531 

3,709 

1,31 1 

COM 

19 

100.373 

382.055 

3,806 

1,337 

COM 

20 

106.432 

417.067 

3,919 

1,366 

COM 

21 

32.386 

1 10.518 

3,413 

1,227 

COM 

22 

422.020 

1.388.241 

3,290 

1,191 

COM 

23 

4.914 

21.148 

4,304 

1,459 

COM 

24 

178.190 

641.096 

3,598 

1,280 

SERV 

25 

1.010.860 

3.199.342 

3,165 

1,152 

SERV 

26 

279.237 

15.90.212 

5,695 

1,740 

SERV 

27 

64.385 

334.997 

5,203 

1,649 

SERV 

28 

214.852 

1.255.215 

5,842 

1,765 

SERV 

29 

7.466 

83.123 

1 1,134 

2,410 

SERV 

30 

1 13.901 

624.275 

5,481 

1,701 

SERV 

31 

24.047 

1 1 1.957 

4,656 

1,538 

SERV 

32 

7.708 

52. 778 

6,847 

1,924 

SERV 

33 

89.181 

61 1.614 

6,858 

1,925 

SERV 

34 

78.252 

437.492 

5,591 

1,721 

SERV 

35 

56.816 

267.470 

4,708 

1,549 

SERV 

36 

327.237 

2.167.957 

6,625 

1,891 

SERV 

37 

99.614 

461.656 

4,634 

1,534 

SERV 

38 

43.343 

223.027 

5,146 

1,638 

SERV 

39 

287.21 1 

959.881 

3,342 

1,207 

SERV 

40 

37.434 

201.225 

5,375 

1,682 

SERV 

41 

133.873 

447.327 

3,341 

1,206 

SERV 

42 

251.238 

1.042.085 

4,148 

1,423 

SERV 

43 

42.728 

318.922 

7,464 

2,010 

SERV 

44 

81.837 

342.242 

4,182 

1,431 

SERV 

45 

1 12.783 

399.519 

3,542 

1,265 

SERV 

46 

53.858 

258.906 

4,807 

1,570 

SERV 


Fonte: IBGE 
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Observação: Neste exemplo, as duas amostras têm o mesmo tamanho, mas traia sr 
apenas de uma coincidência, já que o teste a ser aplicado é válido mesmo para amostras 
de tamanhos diferentes. 

Solução: 

a) Vejamos então inicialmente como ficam os box-plots do salário per capita relati¬ 
vos aos dois grupos de atividades. 



FIGURA 8.9 Box plots para o salário per capita - comércio x serviços 

Esse gráfico já sugere que a dispersão do salário per capita é menor entre as ativida¬ 
des de Comércio do que entre as atividades de Serviços. 

Ainda assim, tentemos aplicar o teste t não-pareado diretamente à variável salário 
per capita. Os resultados obtidos são os seguintes: 


Setor 

N 2 obs 

Média 

Desvio-padrão 

Comércio 

23 

3,786 

0,823 

Serviços 

23 

5,278 

1,760 


Temos, então, 

N 2 de graus de liberdade = 23 + 23 - 2 = 44 


S 2 _ (23 - 1) x 0,823 z + (23 - 1) x 1,760 2 _ t 887 £ 
p 23 + 23-2 


3,786-5,278 . 


r 

( 1 

1 ^ 

1,887 x 


+ — 


L 23 

23 J 


Porém, a diferença significativa entre as dispersões do salário per capita relativas 
aos setores de comércio e de serviços pode ser constatada, tanto através da inspeção 
visual dos Box plots anteriores, quanto pelos próprios valores numéricos dos desvios- 
padrão amostrais. Isso faz com que o teste t não-pareado não seja diretamente aplicá¬ 
vel à variável salário p.c. 

Esse é o motivo pelo qual foi então introduzida a transformação logarítmica. 
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b) Será usado o teste t não-pareado para testar H 0 : p x - p Y = 0 contra Hp p x - p Y ^ 0> 
onde p x e p Y são as médias da variável log (salário per capita) nos grupos comér¬ 
cio e serviços, respectivamente. 

Porém, vejamos inicialmente como ficam os Box-plots de log(salário per capita) rela¬ 
tivos aos dois grupos de atividades. 




FIGURA 8.10 Box Plots para o log (salário per capita ) - comércio x serviços 

Esse gráfico já sugere uma maior equalização das dispersões nos dois grupos depo¬ 
is de aplicada a transformação. Além disso, a proximidade numérica entre os desvios- 
padrão amostrais (a seguir) é mais um motivo para que possamos considerar aplicável 
o teste t não-pareado para comparação de médias no caso da variável log(salário per 
capita). 

Os resultados obtidos foram os seguintes: 


Setor 

N° obs 

Média 

Desvio-padrão 

Comércio 

23 

1,308 

0,221 

Serviços 

23 

1,618 

0,301 


Temos, então. 

Número de graus de liberdade = 23 + 23 - 2 = 44 
s2 (23 - 1) x 0,221 2 + (23 - 1) x 0,301 2 ^ c 


23 + 23-2 
1,308-1,618 


Cbs r — 

( 1 1 3 

0,0696 x 

+ 

23 23 ) 


Por ou iro lado, para 44 g.l., i (W = 2,69 

Como |i„J 5,978 > 2,69 = l„, n , I l„cleve ser rejeitada ao nível a = 1%. 

A conclusão é enlão pela rejeição da hipólese de igualdade entre as médias do 
log(salario pa < apita) relalivas aos setores de comércio e de serviços (o que, de certa 
íorma já se poderia provei pela mera observação dos Box plots anteriores). 
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c) O nível crítico é igual à soma das áreas das duas caudas simétricas da curva da i de 
Sludent com 44 graus cie liberdade c|ue se situam fora do intervalo (- 1,98; ’> 98). 
Consultando a Tabela 11 do Apêndice II, tudo o que poderíamos conc luir é qu< 
neste casoâ < 0,01. Já através de um software apropriado, vemos que o nível crí¬ 
tico é igual a 0,000256. 


Considerações finais sobre o teste t não-pareado: 

a) Existe uma outra versão desse teste para o caso em que a premissa de igualdade 
das variâncias não se aplica. 

b) Na verdade, a hipótese de que g x 2 = o v 2 também pode ser testada (admitindo no¬ 
vamente que as v.a.’s têm distribuição Normal) através de um teste que envolve 
a distribuição F (ver Subseção 8.9.1). Entretanto, esse procedimento não será 
aqui apresentado. 

c) Se os tamanhos amostrais m e n são pequenos e a premissa de Normalidade não é 
atendida, em geral, se apela para algum outro expediente do tipo transformação 
de variável, teste não paramétrico etc. 

d) À medida que crescem os tamanhos m e n das duas amostras, a premissa de Nor¬ 
malidade vai se tornando cada vez menos crucial (devido ao TCL). Além disso, 
se m e n forem ambos grandes, podemos usar como estatística de teste 


X-Y 



v m n 

cuja distribuição de probabilidade, sob H 0 : p x - p Y = 0 é aproximadamente uma 
Normal padrão, mesmo que as variâncias populacionais ct x 2 e o Y 2 não sejam 
iguais. Veja o Exercício 8.7_R. 


8.8.2 Teste t para Amostras Pareadas 

Conforme foi mencionado na introdução desta seção, a diferença básica entre este teste 
e o anterior é que aqui os dados são fornecidos aos pares. Por exemplo, medidas feitas 
na mesma unidade amostrai antes e depois da aplicação de alguma técnica ou tratamen¬ 
to. A idéia é comparar diretamente os dois elementos do mesmo par, através da diferen¬ 
ça entre as respectivas medidas. Assim procedendo, fazemos com que a teoria recaia no 
caso do teste relativo a uma única média, que estudamos na Seção 8.4. 

Sejam (X,,Y,), (X 2 ,Y 2 ),..., (X n ,Y n ) pares de variáveis aleatórias e consideremos as dife¬ 
renças Dj = Xj - Y,, para todo i. Admitamos que D,, D 2 ,..., D„ são variáveis aleatórias iid 
com distribuição comum Normal (p D ; g 2 d ). 


Queremos testar H 0 : p D = 0 contra H,: p D ^ 0. 


A estatística de teste a ser usada é T = 



onde: 
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D é a média amostrai dos D;’s, i = 1,..., n 

S D é o desvio-padrão amostrai dos D,’s, i = 1 ,..., n 

Uma vez escolhido o nível de significância a, rejeita-se H 0 se |T 0 J >t , onde t é o 

í-- i-“ 

2 2 

quantil da t de Student com (n - 1) graus de liberdade à direita do qual há uma área igual 
a a/2. 

Justificativa para esse procedimento: 

Prova-se que se H 0 é verdadeira, T = —tem distribuição t de Student com n - 1 

S D /Vn 

graus de liberdade. 

Observações: 

a ) Quando a hipótese alternativa é do tipo Hp p D * 0 como anteriormente, diz-se 
que o teste é bilateral. 

b) Caso a alternativa fosse do tipo Hp p D > 0, o critério de decisão seria rejeitar H 0 se 
T obs > b-a> com n - 1 graus de liberdade. Teríamos então um teste unilateral. (E se 
Hp p D < 0, qual seria o critério?) 

c) Para mais detalhes sobre a distribuição t de Student, ver Subseção 7.7.2. 


Condições para a aplicabilidade do teste t pareado: 

Basicamente, uma condição deve ser atendida para que se possa aplicar o teste t 
para comparar médias com duas amostras pareadas: a distribuição da variável di¬ 
ferença deve ser Normal. 


EXEMPLO 8.10: O desempenho dos alunos piorou da primeira para a segunda 
prova? 

A tabela a seguir contém as notas na primeira prova (x) e na segunda prova (y) de 
uma amostra de alunos de uma determinada disciplina. Deseja-se testar a hipótese nula 
de que, em média, não houve uma queda nas notas de uma prova para a outra, contra a 
hipótese alternativa de que houve uma queda expressiva na média da primeira para a 
segunda prova. Os dados são os seguintes: 


TABELA 8.2 Notas da primeira e segunda provas para um grupo de alunos 


1 a Pr (x) 

6.3 

1.5 

5.9 

6,4 

5,5 

5,4 

5,4 

8,0 

5,9 

8,0 

6,5 

2,0 

3,6 

6.0 

9,8 

6,8 

5,3 

2a Pr (y) 

3,6 

3.8 

3,0 

6,0 

4,3 

4.6 

6,4 

5,5 

6,0 

4,3 

4,3 

5,2 

3,4 

2,8 

8,3 

71 

5,5 

1 a Pr (x) 

8,7 

6,5 

6,4 

7,7 

8,5 

5,3 

6,9 

8,0 

8,2 

7.1 

8,4 

6.0 

5,5 

7,2 

6,4 

5,5 

6.4 

2a Pr (y) 

8,2 

3.8 

5,5 

6,7 

6,7 

4,4 

3.4 

5,9 

6,0 

5,9 

6,8 

5,0 

6,2 

5,4 

4,7 

3.6 

5.2 


a) Qual entre as duas alternativas seguintes é a mais adequada no que se refere ao 
método estatístico a ser usado neste caso: teste t pareado ou teste t não-pareado? 
Por quê? 
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b) Use o método que você considera o mais adequado para realizar esse tesic de In 
pólese ao nível de significância de 5%. 

Observação: Para simplificar os cálculos são fornecidos os seguintes valores: 



X 

1 

* / 

Média 

6,372727 

5,212121 

1,160606 

Desvio-padrão 

1,727368 

1,400108 

1,541437 


Solução: 

a) Como neste caso as amostras não são independentes, claramente devemos usar 
o teste para amostras pareadas. 

b) D = Nota na primeira prova - Nota na segunda prova 
Aqui H 0 : p D < 0 versus Hp p D > 0. 

Temos então n = 34 pares de dados e 

D*.-1,161 e (S„) ob , - 1,541 -> T ob) = ^ = 4,390 

1,541/ v34 

Por outro lado, n° de graus de liberdade = 34 - 1 = 33 e, como o teste é unilateral, 
a região de rejeição é: 

T obs > 1,692, 

já que este é o quantil da t de Student com 33 graus de liberdade à direita do qual 
há uma área de 5%. 

Como T obs = 4,390 > 1,692, H 0 deve ser rejeitada. Isso significa que, ao nível de 
significância de 5%, os dados trazem evidências suficientes de que houve uma 
queda significativa na média das notas dos alunos da primeira para a segunda 
prova. 

Dê um valor aproximado para o nível crítico neste caso. 

Para verificar se a premissa de Normalidade está sendo atendida aqui, você pode 
construir, por exemplo, um gráfico de probabilidade Normal (ver Montgomery, 
D.C. e Runger, G.C., 2003). 


Sabe-se que, em várias áreas da Ciência, os periódicos com enfoque experimental 
só muito raramente publicam resultados em que não foi identificada nenhuma dife¬ 
rença entre um grupo experimental e um grupo de controle. Menor ainda seria a mo¬ 
tivação para se publicarem resultados de experimentos em que alguém volta a anali¬ 
sar um tema que já tenha sido abordado em uma publicação anterior. Essas duas 
constatações serão agora usadas na seguinte conjectura: 

Suponha que alguém tenha uma idéia de hipótese experimental (a hipótese alterna¬ 
tiva H,) a ser testada, mas que, na verdade, ela seja falsa, isto é, a hipótese H 0 é verda¬ 
deira. Ele realiza um experimento para testá-la, e os resultados encontrados indicam 
que H 0 deve ser aceita. Ele não publica sua conclusão. Vários outros pesquisadores 
têm a mesma idéia e passam pelos mesmos procedimentos obtendo o mesmo resultado. 
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Entretanto, se todos trabalharem a um nível de significância de 5%, como é usual, em 
média uma vez em cada vinte tentativas H 0 será rejeitada apenas por acaso. O “vigési¬ 
mo” pesquisador, que chegou a essa conclusão equivocadamente, publica o seu artigo. 
Já que dificilmente alguém se propõe a pesquisar novamente um tema que já tenha sido 
objeto de uma publicação, o que ele relata não será questionado posteriormente. Desse 
modo, toda a literatura das ciências experimentais pode estar cheia de “conclusões” 
que são puramente fruto do acaso. Comente essa afirmação. 


8.9 TESTES PARA COMPARAÇÃO DE VÁRIAS MÉDIAS 

Quando o objetivo é comparar as médias de mais de duas populações, são coletadas 
amostras de cada uma das populações a serem comparadas. A metodologia de análise 
mais usual difere das que foram apresentadas até aqui, tanto na forma de se calcular a 
estatística de teste quanto no que se refere à sua distribuição de probabilidade. Trata-se 
da Análise de Variância, procedimento assim chamado porque se baseia em um des¬ 
membramento da variação total dos dados em duas parcelas: uma devida à variação en¬ 
tre as amostras e a outra devida à variação dentro de cada amostra. Em nosso caso, 
diremos que o procedimento usado é a Análise de Variância com um critério de classifi¬ 
cação, ou com um fator, porque há somente um fator de interesse que pode provocar a 
diferença entre as médias populacionais. 

A distribuição da estatística de teste sob a hipótese nula é a F de Fisher-Snedecor, 
que é apresentada a seguir. 

ATENÇÃO: A letra F já foi muito usada nos capítulos anteriores para representar a 
função de distribuição acumulada (FDA) de uma variável aleatória (ou duas v.a.'s). 
Aqui a letra F será usada em um sentido totalmente diferente: para nos referirmos a 
um modelo probabilístico específico, a saber, a distribuição de probabilidade F de 
Fisher-Snedecor. 

8.9.1 A Distribuição F 

1. A distribuição F de Fisher-Snedecor (ou, resumidamente, F) é, juntamente com 
a qui-quadrado e a t de Student, uma das distribuições de probabilidade deriva¬ 
das da Normal. 

2. A F é um quociente de duas variáveis aleatórias e depende dos parâmetros Vi e v 2 , 
ambos inteiros e positivos, chamados número de graus de liberdade do numera¬ 
dor e número de graus de liberdade do denominador, respectivamente. 

3. A função de densidade da F é uma curva assimétrica. 

4. O cálculo das probabilidades associadas à F também pode ser feito com o auxílio 
de um software estatístico ou através de consulta a uma tabela de probabilidade 
como a Tabela 111 do Apêndice II. 

5. Para mais detalhes sobre a F, ver as Referências Bibliográficas. 
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Uso da tabela da distribuição F 

Admita que a v.a. F segue uma distribuição F com graus de liberdade v, e v,, respeu iva¬ 
mente, no numerador e no denominador. Ames de mais nada, vamos introduzir um 
pouco de notação: 

• Seja p = P[F < F p ] a área sob a curva da F e à esquerda de F p , sendo F p denominado 

quantil p da F. 



FIGURA 8.1 I Visualização da distribuição F. 


A explicação será feita com base em exemplos numéricos. 

1. Determinação de F p a partir de v,, v 2 e p 

Exemplos: 

Se v, = 6, v 2 = 20 e p = 0,95 —> F p = 2,60 
Se v, = 3, v 2 = 10 e p = 0,99 —> F p = 6,55 

2. Determinação de p = P|_F < F p J a partir de v,, v 2 e F p 

Exemplos: 

Se V! = 10, v 2 = 20 e F p = 2,93 —» p = P[F < F p ] está entre 0,95 e 0,99 
Se v, = 4, v 2 = 10 e F p = 8,03 -> p = P[F < F p ] > 0,99 

8.9.2 Análise de Variância com um Fator (ANOVA) 

Suponha que existam m populações para as quais queremos testar a hipótese nula de 
que não há diferença entre suas médias, ou seja, 

H 0 : As médias populacionais são todas iguais (i.e., H 0 : = p 2 = ... = p m ) 

e 

Hp Há diferença entre as médias populacionais (i.e., H[: pelo menos uma das 
médias é diferente das demais) 

Por exemplo, considerando cinco empresas de grande porte ligadas a diferentes ati¬ 
vidades econômicas, desejamos testar se em média os salários pagos por essas empresas 
são iguais, independente do setor. Ou seja, H 0 : p, = p 2 = p 3 = p 4 = p 5 versus Hp p,* Pj, para 
pelo menos um par de atividades (i,j), com i * j. Nesse caso a variável resposta, ou seja, 
aquela cujas médias queremos comparar é o salário; já o fator, ou seja, o que influi sobre 
o salário, é a atividade da empresa. 
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Seja Y a nossa variável de interesse. 

Y„ é o valor de Y para a j-ésima unidade amostrai da i-ésima amostra. 

Como vimos anteriormente, a Análise de Variância da variável aleatória Y consiste 

m 

em expressar a variação total de Y correspondente a esses N = ^n, dados como 

i=l 

"variação entre” + “variação dentro”. 

Em símbolos, temos 


^^lotal SS cnlrc + SS dcmro , 
onde: 

SS 10la , representa a variabilidade total dos dados 
SS cmre representa a variabilidade entre as amostras 
SS dcmr0 representa a variabilidade dentro das amostras 


Seiam: 



n , 


a média da amostra i, para todo i =1,2, ..., m 


Y 


m n, 

IlT 

m 

In, 

i —1 


a média amostrai global, ou seja, a média de todas as observações 


Matematicamente, temos então: 

In n, 

SS lola , = ^ ^ (Y„ - Y) 2 , (soma dos quadrados das diferenças entre cada observação e 

í=í j=i 

a média global) 


SS C n[rc = ^n, (Y, - Y) 2 , (soma dos quadrados das diferenças entre a média de cada 

i=l 

grupo e a média global, ponderados pelos tamanhos de amostra) 


i 

SS diM(ii = ^ (Y |( - Y ( ) 2 , (soma dos quadrados das diferenças entre cada observa- 


i-i i=i 


ção e a média da amostra à qual pertence) 


A estatística de teste é: 
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e é possível provar que, se H 0 é verdadeira, ela segue uma distribuição í com graus dn li 
berdade (m - 1) no numerador e (N - m) no denominador. 

É usual organizarmos as estatísticas vistas em uma tabela denominada Tabela de 
Análise de Variância (ANOVA), como vemos a seguir: 


Tabela de Análise de Variância (ANOVA): 


Fonte de 
Variação 

Soma de Quadrados 
(SS) 

Graus de 
liberdade (gl) 

Quadrados 
médios (MS) 

F 

Entre amostras 

SSentre 

m - 1 

MC - dentre 

' '-'entre . 

m-1 

entre 

dentro 

Dentro das 
amostras (erro) 

SS d entro 

N-m 

SS 

N/ir — dentro 

1 l;3 dentro . , 

N-m 


Total 

SStotal 

N- 1 




Uma vez fixado o nível de significância a do teste, H 0 deve ser rejeitada se 
(F)obs > Fl-a 

sendo que representa o quantil 1 - a da distribuição F com graus de liberdade (m - 
1) no numerador e (N - m) no denominador. 

Caso contrário, H 0 deve ser aceita. 

Justificativa para o procedimento adotado: 

Devido à forma como foram definidas as somas de quadrados SS emre e SS demro : 

1. Quanto mais afastadas entre si estiverem as médias amostrais Y,, maior tende a 
ser SS emre , e 

2. Quanto mais próximos entre si estiverem os Y tJ relativos a uma mesma amostra i, 
menor tende a ser SS demro ; 

Essa é exatamente a situação em que teremos sérios motivos para rejeitar H 0 . 

Observe que, se as condições 1 e 2 forem atendidas, o valor da estatística de teste F ten¬ 
de a ser grande. 


Trat. 1 
Trat. 2 


Yi 


y 2 

4*”—r 

y 3 


Trat. 3 
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Vejamos agora a situação oposta: 

3. Quanto mais próximas entre si estiverem as médias amostrais Y ( , menor tende a 
ser SS cmrc ; e 

4. Quanto mais afastadas entre si estiverem os Y ip relativos a uma mesma amostra i, 
maior tende a ser SS dcntro . 


Essa é a situação em que tenderemos a aceitar H 0 . 

Observe que, se as condições 3 e 4 forem atendidas, o valor da estatística de leste F ten¬ 
de a ser pequeno. 

Y, 


Trat. 1 
Trat. 2 

Trat. 3 


■-■-■—■—»-» ■-■ ■-» 

Y 2 



Trat. 4 



■ 




Condições para a aplicabilidade da Análise de Variância com um fator: 
Basicamente, duas condições devem ser atendidas para que se possa aplicar a 
Análise de Variância com um fator: 

a) As variâncias das diferentes populações devem ser iguais. 

b) A distribuição da variável deve ser Normal em todas as populações. 

A condição (a) é bem mais crítica do que a condição (b). A condição (b) perde 
muito da sua importância quando os tamanhos amostrais são grandes. A condi¬ 
ção (a) não é tão crítica quando os tamanhos de amostra são todos iguais. 


Há uma série de questões que também são abordadas habitualmente na literatura 
que trata da Análise da Variância: 

a) Em que ordem deve ser realizada a coleta de dados? 

b) Como avaliar a validade das premissas do modelo, usando os próprios dados? 

c) O que fazer se alguma(s) delas não for(em) válida(s)? 

Comentário: A ANOVA é muito usada quando se estuda Planejamento de Experimentos. 
Nesse contexto é costume referir-se à variação de Y entre amostras como “variação devida 
ao modelo” e a variação de Y dentro das amostras como “variação devida ao erro”. 
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EXEMPLO 8.1 I: Comparando três rações para suínos 

Um criador de suínos deseja comparar três tipos de ração para alimentar seus animais 
Para isso, durante um determinado período, ele alimenta 30 animais com a ração A 20 
animais com a ração B e 25 animais com a ração C. Os aumentos de peso (em kg) observa 
dos para esses animais no período considerado são apresentados na tabela a seguir 


TABELA 8.3 Aumento de peso (em kg) de suínos, em respotas a três diferentes rações. 


A 

44 

49 

43 

51 

44 

75 

42 

51 

34 

30 

53 

42 

45 

36 

30 


32 

21 

33 

42 

10 

40 

39 

52 

46 

29 

42 

47 

45 

39 

59 


B 

34 

36 

40 

54 

59 

53 

44 

54 

32 

68 

69 

54 

41 

46 

47 


65 

66 

45 

57 

39 












C 

57 

40 

40 

36 

45 

66 

39 

50 

25 

21 

29 

27 

28 

39 

42 


21 

30 

41 

43 

29 

42 

44 

58 

28 

49 







Temos três amostras. Neste exemplo: 

• o fator é o tipo de ração, 

• os níveis do fator são as diferentes rações, 

• a variável de interesse é o aumento de peso dos suínos. 


Solução: 

Antes de mais nada, verifiquemos a premissa de igualdade das variâncias da variável 
resposta nos diferentes grupos, através de Box Plots simultâneos do aumento de peso 
para as três rações em questão: 



FIGURA 8.12 Box plots de aumento de peso por tipo de ração. 

Esse gráfico e os desvios-padrão a seguir parecem sugerir que as variabilidades do 
aumento de peso correspondentes às três rações podem ser consideradas iguais, o que 
significa que a ANOVA é aplicável a esse conjunto de dados. 
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Temos os seguintes resultados: 


Amostra 1 ( Ração A) 

n, = 30 

Y, = 41,51632 

S, =1 1,87180 

Amostra 2 (Ração B) 

O 

rN 

II 

04 

c 

Yj = 50,13447 

S 2 =l 1,52757 

Amostra 3 ( Ração C) 

n 3 = 25 

Y 3 = 38,68566 

S 3 = 1 1,54964 

Total 

N = 75 

Y= 42,87014 



Usando essas fórmulas, construímos a seguinte tabela de ANOVA: 


Fonte de variação 

Graus de 
liberdade 

Somas de 
quadrados 

Quadrados médios 

F 

p-valor 

Entre os grupos 

2 

1548,1 

774,1 

5,679 

0,005126 

Dentro dos grupos (erro) 

72 

9813.5 

136,3 



Total 

74 

1 1316,6 

153,5 




Conforme a tabela, os números de graus de liberdade são: 

v, = 3 - 1 = 2 no numerador 

v 2 = 30 + 20 + 25 - 3 = 72 no denominador 

Então, pela Tabela da F, vemos que, para a = 0,05, o quantil da F a ser utilizado é 
F 0 .95 = 3,12. 

O valor da estatística de teste F obs = 5,679 (ver tabela de ANOVA) é maior que F 095 = 3,12. 
Concluímos então que existe uma diferença significativa entre os aumentos de peso pro¬ 
porcionados pelas três rações, ou seja, elas não são igualmente efetivas. Note que o valor-p 
de 0,005126 confirma a nossa conclusão. 

Neste caso, o p-valor ou nível crítico é a área da cauda da curva da F de Fis- 
her-Snedecor com graus de liberdade 2 no numerador e 72 no denominador que fica à 
direita de F obs = 5,679. Obter o valor do nível crítico através da tabela da distribuição F é 
uma tarefa quase impossível, já que habitualmente são apresentados nessa tabela ape¬ 
nas os quantis correspondentes à área da cauda = 0,05 e 0,01 (que são os níveis de signi- 
ficância mais usuais). Entretanto, utilizando-se um software adequado é possível 
calcular o nível crítico do teste â = 0,005126, apresentado na tabela de ANOVA. 

Quando o p-valor é menor que 0,05, porém maior do que 0,01, dizemos que a dife¬ 
rença observada é significativa. Se o p-valor é menor do que 0,01 - como ocorre no pre¬ 
sente exemplo - costuma-se dizer que a diferença é altamente significativa. 


8.9.3 Comparações Múltiplas 

Quando, através da ANOVA, a hipótese de médias iguais para as m populações é rejeita¬ 
da e concluímos, portanto, que há diferença significativa entre essas médias, como no 
exemplo anterior, cabe a pergunta: quais são as populações cujas médias diferem efeti- 
vamente entre si?. A resposta pode ser obtida testando-se a significância de cada possí¬ 
vel par de médias. Por motivos teóricos, não é recomendável usar, para cada par de 
medias, diretamente o teste t não-pareado visto na Subseção 8.8.1. lnfelizmente não há 
testes exatos para se testar simultaneamente todas essas diferenças. Contudo existem 
alguns testes aproximados que cosi uinam ser usados na prática. O caso mais comum é o 
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da comparação simultânea de todos os pares de médias dos tratamentos, isto é, tesia 
mos a hipótese H 0 :p, = p p para todo par (i,j) tal que i * j. Há diversos testes sugeridos, to 
dos aproximados, porém neste texto só consideraremos o teste LSD de f isher 

Método da menor diferença significativa (LSD) 

Suponha que, após uma Análise de Variância na qual a hipótese nula é rejeitada, deseja 
mos testar, H 0 : p, = pj contra p> * p p para cada par (i,j), com i < j. 

As médias p t e Pj podem ser consideradas significativamente diferentes, se 

IY, - Yj|> LSD, onde LSD = t,.^ I MS dmlIO (—+ —) 

lí n . n ) 

LSD é a dita a menor diferença significativa (em inglês least significant difference), e 
t lv2 é o valor lido na tabela t de Student, tal que a probabilidade de um valor menor do 

(X 

que ele é 1 - —, para (N - m) graus de liberdade. 

Para usar o método LSD, simplesmente comparamos essa grandeza com a da diferen¬ 
ça observada entre um par de médias amostrais. Se I Y s - Y : | > LSD, concluímos que as 
médias populacionais p, e p 3 são diferentes. 

EXEMPLO 8.12: Comparando três rações para suínos (cont.) 

Voltemos aos dados do Exemplo 8.11. 

Temos m=3, n,=30, n 2 =20, n 3 = 25, N = n t + n 2 + n 3 = 75 e MS demro = 136,3. 

Para a = 0,05 e 72 graus de liberdade, encontramos t^^ to 975 = 1,99. 

Daí, para comparar as médias p t e p 2 , usamos 


LSD = t 


l-a/2,N-m 



(— + —)= 1,99 
n, n 2 


1 136,3 (— + —) = 6,71 
30 20 


Para as médias p, e p 3 , LSD = 1,99 
Para as médias p, e p 3 , LSD = 1,99 


1 136,3 (— + —) = 6,29 
30 25 

(136,3 (— + —)= 6,97 
20 25 


Y,= 41,52; Y 2 = 50,13; Y 3 = 38,69 e as diferenças absolutas entre elas são: 

|Yj - Y 2 1 = 8,62 > 6,71 Significativa 

|Yj - Y 3 | = 2,83 < 6,29 Não significativa 

|Y 2 -YjI = 11,45 >6,97 Significativa 


Vemos que a única diferença não significativa ao nível = 0,05 é Y, - Y 3 
Como Y 2 é muito maior que Y, e que Y 3 , concluímos que a ração B é a que produz o 
maior aumento de peso. 

Exercitando: 
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38,7 41,7 50,1 

FIGURA 8.13 Representação das médias do aumento de peso, para três rações. 


Verifique que teríamos chegado à mesma conclusão usando um nível de significân- 
cia a = 0,01. Quais seriam os valores de LSD nesse caso? 


Observação: Se n, = n 2 = ... = n m = n, o valor de LSD é o mesmo para todas as diferenças 
de médias e é dado por: 

LSD = t,-*^MS*„„ 

Para efetuar as comparações múltiplas existem outros testes, como, por exemplo, os 
testes de Duncan, de Newman-Keuls e de Tukey. Para os dois primeiros recomenda-se 
consultar Montgomery (1996) e para o terceiro, Box, Hunter & Hunter (1976). 


8.10 TESTANDO A INDEPENDÊNCIA ENTRE DUAS VARIÁVEIS 

Aqui o nosso objetivo é testar, com base em dados reais, a hipótese de independência 
entre duas variáveis qualitativas X e Y. Trata-se de uma questão básica, em termos da 
sua importância e ampla aplicabilidade. 

Uma situação concreta em que isso se aplicaria é a que foi vista no Exemplo 2.2 sobre 
consumo cultural. Os dados ali analisados podem ser utilizados para se testar a hipótese 
nula de que “Não existe relação entre a idade do consumidor e o tipo de programa que ele 
prefere” contra a alternativa de que “Existe uma associação entre essas duas variáveis”. 

Aqui, novamente, veremos apenas um dos procedimentos utilizados, a saber, o mais 
usual deles, o teste qui-quadrado para independência. Nesse procedimento, conforme 
o próprio nome indica, se a hipótese nula é verdadeira, a estatística de teste tem distri¬ 
buição qui-quadrado, que veremos a seguir. 

8.10.1 A Distribuição Qui-quadrado 

1. A distribuição Qui-quadrado é, juntamente com a F de Fisher-Snedecor e a t de 
Student, uma das distribuições de probabilidade derivadas da Normal. 

2. A Qui-quadrado depende do parâmetro v, inteiro e positivo, chamado número 
de graus de liberdade. 

3. A função de densidade da Qui-quadrado c uma curva assimétrica. 

4. O cálculo de probabilidades associadas a Qui-quadrado também pode ser feito 
com o auxílio de um software estatístico ou através de consulta a uma tabela de 
probabilidade como a labela IV do Apêndice II. 

5. Para mais detalhes sobre a Qui quadrado, ver as Referências Bibliográficas. 
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Uso da Tabela da Qui-Quadrado 

Admita que a v.a. j} segue uma distribuição Qui-quadrado com v graus de liberdade. 
A figura a seguir mostra a função densidade de j}. 


Notação: 

• p representa a área sob a curva e à esquerda de x 2 p • 

• Em símbolos: p = P[% 2 < Xp 1 



FIGURA 8.14 Visualização da distribuição Qui-quadrado. 


A explicação será feita com base em exemplos numéricos. 

1. Determinação de x 2 p a partir de v e p 
Exemplos: 

• Se v = 3 e p = 0,95 -> Xo ,95 = 7,815 

• Se v = 8 e p = 0,99 —> X 099 = 20,090 

2. Determinação de p = P(x 2 <X ,J a partir de v e x p 
Exemplos: 

• Se v = 4 eXp = 1,25 —> p = P[x 2 <X p ] está entre 0,100 e 0,250 

• Se v = 10 ex 2 p = 16,87 —» p = P(x 2 ^XjJ est á entre 0,900 e 0,950 

8.10.2 Teste Qui-quadrado para Independência 

Dadas duas variáveis aleatórias discretas X e Y, lembremos que, se X e Y são indepen¬ 
dentes, devemos ter 

P[X = x, Y = y] = P[X = x].P[Y = y], 

para todo par (x,y). 

A idéia aqui é comparar a distribuição conjunta amostrai de X e Y (correspondente 
ao lado esquerdo da igualdade anterior), com o produto das respectivas distribuições 
marginais amostrais (correspondente ao lado direito da mesma igualdade). Quanto 
menor for a distância entre elas, mais fortes serão as razões para se supor que as variá¬ 
veis X e Y são independentes. 
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Admita que X pode assumir os valores a, , a 2 ,a K e Y pode assumir os valores 
bj , b 2 , b L . 

Monta-se então uma tabela de contingência, como a seguir: 


Valores de X 

Valores de Y 

Total 

bi 

... 

bi 

... 

b L 

a i 

nu 


nn 

... 

nu 

ni- 


* 





* 

a k 

n k i 


no 


OkL 

n k . 



* 

• 

1 

* 

J 

a K 

n k i 

... 

n Kl 

... 

n K L 

n<- 

Total 

n.i 


n., 


n-L 

n 


sendo 

n k , = número de observações onde, ao mesmo tempo, x = a k e y = b,, para todo par (k,l) 

n k . = n kl + ... + n kL , V k = 1,...,K, ou seja , n k é a frequência marginal quando X=a k 
n., = n u + ... + n K1 , V 1 = 1,...,L, ou seja , n,é a frequência marginal quando Y=b, 
n = ^n kl = ^n k = ^n ,, ou seja, n é o número total de observações 

kl k I 

Queremos testar 

H 0 : X e Y são independentes contra H,: existe associação entre X e Y 
ou seja, 

H 0 : P[X = a k , Y = bj = P[X = a k l . P[Y = b,J, para todo k e para todo 1 
contra 

H,: P[X = a k , Y = bj * P[X = a k ].P[Y = b,], para algum par (k,l) 

A partir dos dados amostrais, podemos calcular então 

Estimativa de P[X = a k , Y = b,] : n kl /n 

Estimativa de P[X = a k ] : n k ./n 

Estimativa de P[Y = b,] : n n /n 

Portanto, se H 0 é verdadeira, devemos ter n k] /n = (n k ./n) x (n., /n) e, multiplican- 

n k xn i 

do-se os dois lados da igualdade por n, obtemos n kl = — : -- 

n 

Por definição, n k , é a frequência observada quando X = a k e Y = b, 

Por outro lado, n,, = ° 1 X 11 é a frequência esperada de ocorrências na posição (k,l) 

n 

da tabela, quando há independência entre X e Y, ou seja, quando H 0 c verdadeira. 
n k x n, 

Notaçao: E w = 

n 
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K. i X , ( — p 

A Estatística de teste é y 1 = 2h 


) 2 


e pode-se provar que, se I l„é verdadei- 

k=i 1=1 t k| 

ra, sua distribuição se aproxima cada vez mais de uma Qui-quadrado com (K -1) í I I ) 
graus de liberdade, à medida que cresce o tamanho n da amostra. 

Dado o nível de significância a, o critério de decisão é: 

Rejeitar H 0 , se y 2 ohs >y\_ a , isto é, se o valor observado da estatística de teste for 
superior aXi o quantil 1 - ada qui-quadrado com (K- 1) (L- 1) g.l. Caso contrário, 
aceitar H n . 


Condições para a aplicabilidade do teste Qui-quadrado para independência: 
Como regra prática, considera-se que o teste Qui-quadrado descrito é aplicável 
aos dados que compõem uma tabela de contingência desde que cada uma das fre¬ 
quências esperadas E kI seja > 5 e também desde que o número total de observa¬ 
ções n seja > 30. Caso alguma dessas condições não seja atendida, em vez do teste 
Qui-quadrado, recomenda-se o uso de um procedimento não-paramétrico, 
como, por exemplo, o chamado Teste Exato de Fisher. 


EXEMPLO 8.13: Há relação entre o diagnóstico de psicose e o sexo do 
paciente? 

Os dados da Tabela 8.4 se referem a uma amostra aleatória de 483 pacientes interna¬ 
dos no Hospital Espírita de Porto Alegre durante o primeiro semestre de 1996. 

a) Testar a hipótese de independência entre sexo e diagnóstico de psicose, ao nível 
a = 1%. 

b) Obter o nível crítico. 

Solução: 

a) A Tabela 8.5 contém os valores esperados em cada posição da Tabela 8.4, caso 
houvesse independência entre as variáveis. 


TABELA 8.4 Tabela de contingência relativa às internações no Hospital 
Espírita de Porto Alegre durante o primeiro semestre de 1996 


Diagnóstico de Psicose 

Sexo 

Total 

Masculino 

Feminino 

Psicoses esquizofrênicas 

68 

74 

142 

Outras psicoses não-orgânicas 

35 

61 

96 

Síndrome de dependência do álcool 

85 

7 

92 

Psicoses afetivas 

25 

61 

86 

Síndrome de dependência das drogas 

15 

2 

17 

Outros 

30 

20 

50 

Total 

258 

225 

483 


Fonte: Jornol Brasileiro de Psiquiatria, volume 48, setembro de 1999. 
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TABELA 8.5 Diagnóstico de Psicose x Sexo - Tabela com os valores 
esperados sob a hipótese de independência 


Diagnóstico de Psicose 

Sexo 

Total 

Masculino 

Feminino 

Psicoses esquizofrênicas 

75,85 

66,15 

142 

Outras psicoses não-orgânicas 

51,28 

44,72 

96 

Síndrome de dependência do álcool 

49,14 

42,86 

92 

Psicoses afetivas 

45,94 

40,06 

86 

Síndrome de dependência das drogas 

9,08 

7,92 

17 

Outros 

26,71 

23,29 

50 

Total 

258 

225 

483 


O valor observado da estatística de teste é então 


X obs 


(68 - 75,85) 2 (74-66,15) 


75,85 


+ 


66,15 


12 -?.^ =98 , 64 


23,29 


Já que o número de graus de liberdade aqui é (6 -1) x (2- 1) = 5 , consultando 
a Tabela IV do Apêndice 11 ou um software adequado vemos que, ao nível de sig- 
nificância a = 1%, H 0 deve ser rejeitada se a estatística de teste for superior a 
15,086. 

Como 98,64 > 15,086 , rejeitamos H ( , neste caso. 

Conclui-se então que, ao nível a = 1%, os dados disponíveis trazem evidência 
suficiente de associação entre o diagnóstico de psicose e o sexo dos pacientes do 
hospital. Para ilustrar essa diferença entre os padrões masculino e feminino, 
observemos que a incidência de casos de Síndrome de dependência do álcool é 
muito maior entre os homens, enquanto as Psicoses afetivas são muito mais fre¬ 
quentes entre as mulheres. 

b) O nível crítico ou p-valor é a área sob a curva do Qui-quadrado com cinco graus 
de liberdade e à direita de 98,64, que é igual a 1,021 x 10 19 . Esse valor pode ser 
obtido diretamente através do uso de um software adequado. Por outro lado, 
com base na Tabela IV, só poderíamos afirmar que p-valor « 0,005. ■ 


Exercitando: 

1. Verifique se as condições para aplicabilidade do teste Qui-quadrado para inde¬ 
pendência são atendidas no exemplo anterior. 

2. Use o teste Qui-quadrado para testar a independência entre as variáveis catego¬ 
ria e classe do índice de Massa Corporal no caso do Exemplo 2.1, que trabalha 
com dados anlropométricos. 

A literatura propõe também outros procedimentos de teste, visando analisar a ques¬ 
tão da interdependência de variáveis aleatórias: 

• I este exalo de I isher (ja mencionado), mais apropriado quando o numero n de 
obseivaçòes i relalivamenle pequeno. 

• I est< sobre o coefii icnle de correlação entre as vai iáveis envolvidas, se elas forem 
quantitativas (ver Exercício Proposto 8.9 P). 
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RESUMO DO CAPÍTULO 8 

• O objetivo de um teste de hipótese é avaliara validade de uma afirmação so 
bre determinada característica da população, usando para isso os dados de 
uma amostra. Essa característica é representada pela v.a. contínua (resp. clis 
creta) X, cujo comportamento probabilístico é expresso pela função de densi 
dade f (resp. função de probabilidade p), com parâmetro 0, que tem valor des¬ 
conhecido. 

• Em um teste existem duas hipóteses envolvidas: H 0 , denominada hipótese 
nula, e H b denominada hipótese alternativa. 

• O procedimento de teste de hipótese consiste em estabelecer um critério de de¬ 
cisão que leve a aceitar ou rejeitar H 0 , com base nos valores amostrais. 

• A Estatística de teste é uma função da amostra aleatória utilizada para definir o 
critério de decisão. 

• Estabelecer o critério de decisão consiste em dividir o conjunto dos valores 
possíveis da estatística de teste em duas partes denominadas região de aceita¬ 
ção, A e região de rejeição, R , da hipótese nula. 

• Em um teste de hipótese há dois tipos possíveis de erro de decisão: 

Erro I - Rejeitar H 0 , quando H 0 é verdadeira 

Erro II - Aceitar H 0 , quando H 0 é falsa. 

• As probabilidades de ocorrência dos erros são a = P [ Erro I ] e (3 = P [ Erro II1. 

• Uma hipótese simples supõe um único valor para o parâmetro, enquanto uma 
hipótese composta supõe mais de um valor. A hipótese nula sempre é tratada 
como uma hipótese simples. 

• A probabilidade de erro I, a, é o nível de significância do teste, cujo valor é ar¬ 
bitrado pelo pesquisador, em geral, igual a 0,05 ou 0,01. 

• O nível crítico ou p-valor do teste é o menor valor de a para o qual, ainda rejei¬ 
taríamos H 0 de acordo com os dados observados. 

• O poder do teste é a capacidade de ele rejeitar corretamente a hipótese nula 
quando a hipótese alternativa for verdadeira. 
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Procedimentos de teste de hipóteses, com nível de significância a e amostra de tamanho n 


Parâmetro 

Condição 

Hipóteses 

Região de Rejeição de H 0 

P 

(média) 

a 

conhecido 

H 0 : p = Po 

H,: p * po 

ou ^ > ^o + ^ z i-cV2 

H 0 : M Po 

H| ; p > Po 

X >P 0 + ^ z |-a 

H 0 : p > po 

H |: p < po 

x<Mo ~7^ Z| -“ 

a desconhecido 

H 0 : P = Po 

H,: p* po 

- s - s 

X <Po T = ^, a OU X >Po + ~J=^ a 
vn I-- Vn l~ 

H 0 : p < po 

H,: p > po 

* > * i ° + ;^ t| - a 

H 0 : p > po 

H,: p < po 

x< ^°‘7^ t,-a 

P 

(proporção) 

npo(l-po) > 3 

H 0 : P = Po 

H i : p * Po 

P>Po + Z l-<V 2 --J 
P < Po “ Z \-a /2 ’l 

p 0 (| - p ») O u 

n 

JpoO-Po) 

H 0 : P £ Po 

H,: p > po 

P>P 0 + Z l-a^ 

PoC-Po) 

n 

H 0 : P £ Po 

H,: p < po 

P < Po — Z l-a ’ yj 

PoO-Po) 

n 


Obs.: No caso de se usar a t de Student, o número de graus de liberdade é n - 1. 


• Existem duas categorias de testes para comparação de duas médias: os testes 
pareados e os não-pareados. Nos testes não-pareados temos duas amostras in¬ 
dependentes, enquanto nos testes pareados os dados são fornecidos aos pares. 


Procedimentos de teste para comparação de duas médias, com nível de significância a 


Categoria 
do teste 

Condições 

Hipóteses 

Estatística de Teste 

Região de 
Rejeição de H 0 

Não-pareado 

0x = 0y ~ ty 
X-N^o 2 ,) e 

y-N(p Y: o 2 ) 

H 0 : Px - Py = 0 
H,: px - Py* 0 

j- X-Y _ 

ITobs^t, a 

2 

n° g. 1 = 
m + n - 2. 

WH) 

r2 (m-l)S 2 x +(n-l)S 2 

m + n - 2 

e m e n são os tamanhos 
amostrais 

Pareado 

D; = Xj - Yj 
D~Normal (p f > of ,) 

H 0 : Pd = 0 

Hp Pd * 0 

s D /V^ 

onde n é o tamanho da 
amostra 

l T oJ>t, u 

2 

n° g, 1 = n - 1 


Obs.: I sses tesies são bilaterais. No caso unilateral, em vez de duas caudas de area 
a/2 c ada, usa-se somente uma cauda de área a. 
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A Análise de Variância (ANOVA) é um teste de hipótese para comparar mais 
de duas médias populacionais. 

As hipóteses da Análise de Variância são: 

H 0 : M-i = M-2 = ••• = Mm e 

H,: pelo menos uma das médias é diferente das demais 
A distribuição da estatística de teste sob a hipótese nula da ANOVA é a F de Fisher- 
Snedecor (ou, resumidamente, F). 

A v.a. com distribuição F depende dos parâmetros v, e v, ambos inteiros e posi¬ 
tivos, chamados números de graus de liberdade, do numerador e do denomi¬ 
nador, respectivamente. 

É usual organizar as estatísticas relacionadas à Análise de Variância na tabela 
de ANOVA, descrita a seguir: 


Fonte de variação 

Soma de 
quadrados (SS) 

Graus de 
liberdade (gl) 

Quadrados 
médios (MS) 

F 

Entre amostras 

SSgntre 

m-l 

SS 

MC - JJ entre 

1 1 -'entre 

m-l 

MS 

1 -^entre 

MS 

3 dentro 

Dentro das amostras 
(erro) 

SSçjentro 

m 

Z n i~ m 

i=l 

rvic — SS d e ntro 


1 '-'dentro / \ 

Z n ,- m 

V i=l J 

Total 

SStotal 

m 

i".-' 

i=l 




m n 


Nessa tabela: SS entre = £n t (Y, - Y) 2 , SS demro = £ £(Y 4j - Y j ) 2 e 

i —1 i=l j=l 


ix 


SS, ola i = “ Y ) 2 ’ onde: Y i = —-» P ara todo i =1,2,.... 

í=í j=i m 


m 


e Y = 


m n, 

I2X 

i=I j-1 


Hl 

i=l 


Quando, através da ANOVA, conclui-se que há diferença significativa entre as 
médias, o próximo passo é verificar qual(is) média(s) difere(m) das demais. 
Essa verificação é feita através dos testes de comparações múltiplas. 

O teste LSD é um teste de comparações múltiplas em que as médias p, e p, são 
consideradas significativamente diferentes se: 

|Y, — Yj| > LSD, 
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ondeLSD = t,_ 


<V2. 


MS dcn(ro (— + —), sendo o número de graus de liberdade v 
n ; n ; 




m. 


i=l 


• A distribuição Qui-quadrado depende do parâmetro v, inteiro e positivo, cha¬ 
mado número de graus de liberdade. 

• O teste Qui-quadrado para independência lesta se duas variáveis qualitativas 


k ^ i ^ ^ — H ) 2 

X e Y são independentes. A estatística de teste é % 2 = 


que tem 


k=l 1=1 


distribuição Qui-quadrado com (K-1)(L-1) graus de liberdade, onde n kl e E kl 
são, respectivamente, a freqúência observada e a freqúência esperada (sob in¬ 
dependência) na posição (k,l). 

O critério de decisão é: rejeitar H 0 , se x 2 obs > X ] _ a on de x, _ a é o quantil (1 - a) 
da Qui-quadrado com (K - 1) (L - 1) g.l. Caso contrário, aceitar H 0 . 


EXERCÍCIOS RESOLVIDOS 

8.I_R) Revendo conceitos básicos 

Quando estamos testando hipóteses relativas a um parâmetro de uma distribuição 
de probabilidade: 

a) O nível de significância é a probabilidade de se aceitar a hipótese nula quando 
esta é verdadeira. Sim ou não? 

b) A região de rejeição corresponde aos valores do parâmetro que tornam falsa a hi¬ 
pótese nula. Sim ou não? 

c) A estatística de teste é igual à diferença entre as probabilidades de erro de tipo I e 
de tipo II. Sim ou não? 

d) O nível crítico é tanto maior quanto mais a hipótese nula for compatível com os 
dados disponíveis. Sim ou não? 

e) Se o tamanho da amostra está fixado, qualquer redução da probabilidade do 
Erro II obrigatoriamente implicará um aumento da probabilidade do Erro 1. Sim 
ou não? 

Solução: 

a) Não. O nível de significância é a probabilidade de se rejeitar a hipótese nula 
quando esta é verdadeira. 

b) Não. A região de rejeição corresponde ao conjunto de valores da estatística de 
teste que nos levam a rejeitar a hipótese nula. 
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c) Não. A estatística de teste é o resultado de um cálculo leito a partir dos dados, 
com base no qual se toma a decisão de aceitar ou rejeitar a hipótese nula 

d) Realmente, o nível crítico é tanto maior quanto mais a hipótese nula íor compa¬ 
tível com os dados disponíveis. Por isso mesmo ele pode ser interpretado como 
uma medida do grau de compatibilidade entre H n e os dados. 

e ) Sim, para um n fixado, a única forma de se diminuir p, a probabilidade de se co¬ 
meter o Erro II, é mover a fronteira que separa as regiões de aceitação e de rejei¬ 
ção, reduzindo a região de aceitação e, conseqüentemente, ampliando a região 
de rejeição. Isso acarretará necessariamente em um aumento de a, a probabili¬ 
dade de se cometer o Erro I. 


8.2_R) Testando hipóteses sobre a taxa de analfabetismo 

Queremos testar H 0 : p > 0,20 contra H,: p < 0,20, onde p é a proporção de pessoas 
analfabetas em uma dada região. Para isso foi realizado um experimento com n = 40 
pessoas sorteadas aleatoriamente nessa população. Entre essas constatou-se que seis 
eram analfabetas. 


a ) Qual a decisão a ser tomada ao nível ct = 5%? Por quê? 

b) Qual o nível crítico? 

c) Qual a probabilidade de ser cometido o Erro II se, para o teste obtido em (a), ti¬ 
vermos p = 0,15? 

Solução: 

Seja X o número de analfabetos entre as n = 40 pessoas sorteadas. Sabemos que X é 
uma variável aleatória cuja lei de probabilidade é uma Binomial com parâmetros n = 40 
e p igual à proporção populacional de analfabetos nessa população. A estatística de tes- 

te a ser usada aqui é a proporção amostrai p = —. 

Devido à forma como foram definidas as hipóteses H 0 e El,,é natural que valores altos 
de p nos levem a aceitar H 0 , enquanto valores baixos de p nos levem a rejeitar H 0 . 


a) As regiões de aceitação e de rejeição serão determinadas de tal forma a que a pro¬ 
babilidade de ocorrência do Erro I seja de 5%. Digamos que o ponto de corte que 
separa as duas regiões seja C, de tal forma que 
se p < C, H 0 é rejeitada e se p > C, H 0 é aceita. 


Devemos ter a = 0,05 = P(Rejeitar H 0 }, quando H„ é verdadeira. Ou seja, 0,05 = 
P[p < Cl, quando p > 0,20. Trabalhemos então na fronteira entre H 0 e H,, ou seja, 

com po = 0,20. A lei de X é então uma Binomial com n = 40 e p 0 = 0,20, e a distri¬ 
buição de p pode ser aproximada por uma Normal com média p 0 = 0,20 e des¬ 
vio-padrão yj Po (1 - Po )/n = 0,0632. Então temos: 


0,05 = P[p< C] = P 


z< 


C -0,20 
0,0632 


o que implica que 


C -0,20 
0,0632 


= -1,645. Ou seja, 


aproximando, C = 0,096. Como p obs = 6/40 = 0,15, a hipótese H 0 deve ser aceita. 
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b) 


Como H 0 foi aceita para a = 0,05, o nível crítico â é necessariamente maior que 
0,05. Na verdade, 


â =P[p < 0,15] = P 


Z < 


0,15-0,2 

0,0632 


= P[Z < -0,791] =0,214 


c) Admitamos que p = 0,15. Nesse caso, E(p) = 0,15 e DP(p) = ^0,15 x 0,85/40 = 
0,0565. Então, 


P = P[p>0,096] = P 


Z> 


0,096-0,15 

0,0565 


= P [Z >-0,956] = 0,830. 


8.3_R) Investigando a relação de dependência entre altura 
e continente de origem 

Trinta atletas de diferentes países foram selecionados para participar de uma compe¬ 
tição. A tabela aqui apresentada informa a altura (em metros) e o país de cada um desses 
atletas. 

a) Com base nesses dados, monte uma tabela de contingência, com as definições de 
linhas e colunas conforme indicado a seguir: 


Classe de Altura (em metros) 

Continente de Origem 

Total 

América 

Europa 

Outros 

Menos de 1,70 





Mais de 1,70 





Total 






b) Verifique se são atendidas as premissas necessárias para a aplicação do teste Qui- 
quadrado para independência entre as variáveis “classe de altura” e “continente 
de origem”. 

c) Teste a hipótese H 0 : as variáveis “classe de altura” e “continente de origem” são 
independentes contra H,: existe associação entre as variáveis “classe de altura” e 
“continente de origem”, ao nível de significância a = 5%. 

d) Qual o nível crítico neste caso? 

Aqui estão os dados: 


Altura (m) 

País de origem 

1,76 

França 

1,82 

Japão 

1,68 

Argentina 

1,64 

Inglaterra 

1,72 

India 

1,58 

Peru 

1,75 

Alemanha 

1,69 

Austrália 
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1,65 

Portugal 

1,63 

Brasil 

1,79 

México 

1,73 

Uganda 

1,67 

Bélgica 

1,62 

China 

1,65 

Panamá 

1,60 

Espanha 

1,80 

Indonésia 

1,67 

Dinamarca 

1,65 

Estados Unidos 

1,71 

África do Sul 

1,74 

Holanda 

1,71 

Colômbia 

1,68 

Canadá 

1,75 

Filipinas 

1,73 

Suíça 

1,69 

Angola 

1,77 

Itália 

1,64 

Venezuela 

1,72 

Nigéria 

1,76 

Paraguai 


Solução: 

a) Alocando cada um dos 30 atletas à sua respectiva posição dentro da tabela de 
contingência, obtemos as seguintes contagens n kl de ocorrências: 


Classe de Altura 
(em metros) 

Continente de Origem 

Total 

América 

Europa 

Outros 

Menos de 170 

7 

5 

3 

15 

Mais de 170 

3 

5 

7 

15 

Total 

10 

10 

10 

30 


b) As frequências esperadas E kl (sob independência) em cada uma das posições da 
tabela seriam as seguintes: 


Classe de Altura 
(em metros) 

Continente de Origem 

Total 

América 

Europa 

Outros 

Menos de 170 

5 

5 

5 

15 

Mais de 170 

5 

5 

5 

15 

Total 

10 

10 

10 

30 


Como o tamanho total da amostra é n = 30 e cada freqüência esperada é igual a 5, 
estão atendidas as exigências necessárias para a aplicação do teste Qui-quadrado. 
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c) O valor observado da estatística de teste, calculado a partir dos dados, é então 

,.2 _ (7 -5) 2 , (5-5) 2 , (3 - 5) 2 , (3-5) 2 , (5 - 5) 2 , (7-5) 2 

A. obs — _ ' 1 I 

5 5 5 5 5 5 

Para decidirmos pela aceitação ou pela rejeição de H 0 , devemos comparar esse 
valor com o quantil da distribuição Qui-quadrado com (2-l)x(3-l) = 2 graus 
de liberdade correspondente a a = 5%, que é Xo 95 = 5,991. 

Comox^, bs = 3,2 < 5,991 = x, 2 ab , ao nível de significância de 5%, não há evidên¬ 
cias suficientes para que se rejeite a hipótese nula de que as variáveis “classe de 
altura” e “continente de origem” são independentes. 

d) O nível crítico corresponde à área da cauda à direita de 3,2 da curva de densidade 
da Qui-quadrado com 2 graus de liberdade. Com base na Tabela IV do Apêndice 
II, poderíamos então concluir que o p-valor está entre 10% e 25%. Consultando 
um software adequado, vemos que p-valor = 0,202, ou seja, 20,2%. 

8.4_R) Comparação entre os graus de dificuldade de duas provas de Estatística 

No dia 4/5/2006, um professor aplicou provas de Estatística a duas turmas. Os resul¬ 
tados obtidos foram os seguintes: 

Turma da Manhã: número de alunos = 38 

7.5 7,5 9,0 5,5 5,5 3,5 5,0 5,0 2,5 8,5 4,0 7,0 7,0 7,5 7,5 3,0 9,0 8,0 5,0 

6,0 7,5 8,0 4,5 7,0 10,0 9,0 8,0 6,0 7,5 5,5 8,0 7,5 8,5 6,5 6,0 7,5 10,0 9,0 

Média amostrai = 6,83 Desvio-padrão amostrai = 1,87 
Turma da Tarde: número de alunos = 40 

3.5 3,5 7,5 7,5 8,0 7,0 4,0 10,0 9,5 6,5 5,5 9,0 5,5 5,0 5,0 7,0 7,0 7,5 5,5 7,0 

3,5 4,5 4,0 5,0 9,5 7,0 7,0 8,0 7,5 5,5 6,0 6,5 7,0 5,0 7,0 4,5 6,5 5,0 6,5 7,0 

Média amostrai = 6,34 Desvio-padrão amostrai = 1,67 

Depois de aplicadas as provas, alguns alunos da tarde alegaram que a prova da ma¬ 
nhã tinha sido mais fácil e que, por isso, a turma da tarde tinha sido prejudicada. 

O professor era o mesmo, e foi usado o mesmo material didático, em ambos os ca¬ 
sos. Além disso, supõe-se que em média os alunos de uma turma estudaram tanto 
quanto os da outra. Também não havia nada que indicasse que os alunos de uma tur¬ 
ma fossem academicamente mais fortes que os da outra. Assim sendo, as médias po¬ 
pulacionais podem ser vistas como representativas do nível de facilidade de cada 
uma das duas provas. 

a) Teste a hipótese nula de médias populacionais iguais contra a hipótese alternati¬ 
va de que a média da turma da manhã é maior que a da turma da tarde, ao nível 
de significância de 5%. Justifique a sua resposta. 

b) O que se pode afirmar sobre o nível crítico neste caso? 

c) O que se pode concluir sobre esse tema de uma forma geral? 
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Solução: 

a ) Neste caso temos H 0 : jli m = p T versus H,: jli m > p T , onde 
p M = média populacional das notas na prova da manhã. 
p T = média populacional das notas na prova da tarde. 


Partindo das premissas de que: 

• A distribuição das notas segue uma curva Normal, em ambas as provas (cuja 
veracidade poderia ser apurada a partir dos próprios dados, por exemplo, 
através de gráficos de probabilidade Normal). 

• Os desvios-padrão populacionais das notas são iguais nas duas provas, o que 
parece razoável, dado que os desvios-padrão amostrais são bastante próximos 
entre si: S M = 1,87 e S T = 1,67 (para confirmar a validade dessa suposição tam¬ 
bém podem ser obtidos e comparados os respectivos Box plots)\ 

podemos aplicar aos dados o teste t de Student para amostras não-pareadas. 


A estatística de teste é T = 


X M ~ X T 


1 


r, onde 


1 1 

— + — 


V n M 


n 


t y 


n M = 38 x M = 6,83 S M = 1,87 n T = 40 X T = 6,34 

2 , f A A n.,i £L~rl 

= 3,134 


S T = 1,67 


2 (38 - 1) x 1,87 2 + (40 - 1) x 1,67 


s; = 


38 + 40-2 


obs 


6,83 

-6,34 

1 

( 1 1 3 

3,134 x 

-1- 

i 

{38 40 ) 


= 1,222 


Por outro lado, como se trata de um teste unilateral, o critério de decisão é: 

Rejeitar H 0 se T obs > t Ua . Caso contrário, aceitar H 0 . 

O número de graus de liberdade é 38 + 40 - 2 = 76 e, para a = 5%, temos 
t 095 = 1,665. Como T obs = 1,222 < 1,665 = í 095 , a hipótese H 0 deve ser aceita. Ou 
seja, ao trabalharmos ao nível de significância de 5%, com base nos dados, não 
há evidências de que a média p M seja superior à média p T . 

b) Como H 0 foi aceita ao nível a = 5%, é claro que o p-valor é maior que 5%. Na ver¬ 
dade, p-valor = P [T > 1,2221, onde T segue uma lei de probabilidade t de Student 
com 76 graus de liberdade. Então, consultando um software adequado, vemos 
que p-valor = 0,113 ou 11,3%. O que poderia ser dito sobre o p-valor com base 
na Tabela II neste caso? 

c) A análise aqui apresentada nos leva a concluir, com base nos dados, pela plausi¬ 
bilidade da hipótese nula de que o nível de dificuldade foi o mesmo nas duas 
provas. 

Obs: 1) Notemos que o procedimento no de teste para H 0 : p M = p T contra Hp p M > p T é 
exatamente o mesmo que usaríamos para testar H 0 : p M < p r contra Hp p M > p T . 
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2) Aqui, como os tamanhos de amostra são ambos bastante grandes poderia ter sido 
usado também o procedimento sugerido no item (d) das “Considerações finais sobre o 
teste t não pareado”, como foi feito no Exercício 8.6_R. Use este procedimento e com¬ 
pare os resultados. 

8-5_R) Avaliando a qualidade da graduação em Administração 

Seja p a proporção dos profissionais formados por uma Instituição de Ensino Superior 
(1ES) que estão bem preparados. 

Suponha que em um determinado país, entre as IES que oferecem cursos de gradua¬ 
ção em Administração, há: 

• Cursos de boa qualidade, onde p = 0,80 (entre os profissionais que fizeram um 
curso de boa qualidade, 80% estão bem preparados) 

• Cursos de má qualidade, onde p = 0,60 (entre os os profissionais que fizeram um 
curso de má qualidade, 60% estão bem preparados) 

O governo decide então adotar um sistema que visa avaliar, por amostragem, o nível 
de ensino de Administração em uma dada IES e usa como critério de decisão o seguinte: 

Sorteia aleatoriamente n = 50 entre os formandos daquela IES e os submete a uma 
prova de conhecimento (a mesma para todas as IES). Se o número de aprovados na 
amostra for inferior a 35, aquele curso está descredenciado. Caso contrário, ele é autori¬ 
zado a continuar funcionando. 

Formule o problema em um contexto de Teste de Hipótese. 

Esclarecimento: 

Antes de mais nada, vale a pena deixar claro para o leitor que esta é uma situação idea¬ 
lizada e artificial, ou seja, pouco realista. O problema foi formulado dessa maneira para 
que a sua resolução exigisse somente o uso dos conceitos básicos de Teste de Hipótese e 
o conhecimento do Cálculo de Probabilidades. Especificamente, são premissas pouco 
realistas as seguintes: 

• A proporção p dos profissionais bem formados de qualquer IES desse país se encai¬ 
xa exatamente em um dos dois perfis aqui apresentados: p = 80% (boa qualidade) 
ou p = 60% (má qualidade). 

• Toda turma de futuros administradores formados por uma dada IES tem pelo me¬ 
nos 50 pessoas. 

• A prova a ser feita pelos formandos é infalível, ou seja: quem está bem preparado é 
necessariamente aprovado; e quem está mal preparado é necessariamente repro¬ 
vado. (Estão descartadas as possibilidades de: alguém ser reprovado porque se 
saiu mal na prova devido a nervosismo, alguém ser aprovado apenas porque teve 
sorte etc.) 

Solução: 

\ emos uma amostra aleatória X,, X 2 , ..., X 30 onde 

X, = 1, se o formando daquela IES é aprovado 
X = 0, se formando daquela IES c reprovado 
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Isso quer dizer que o modelo probabilístico para a situação de um formando sortea¬ 
do ao acaso de uma 1ES genérica é a distribuição de Bernoulli com parâmetro p , onde 

P(sucesso) = P(aprovação na prova) = p 

A hipótese nula é H 0 : p = 0,80 (ensino de boa qualidade) 

A hipótese alternativa é H, : p = 0,60 (ensino de má qualidade) 



Nesse caso, em vez da proporção amostrai p, será usada como estatística de teste t = 
X { , ou seja, é o número de aprovados na amostra. 


i=l 


O critério de decisão adotado é: Rejeitar H 0 se X . < 35 . Caso contrário, aceitar H 0 . 

i=l 

Regiões de aceitação e de rejeição 



As probabilidades associadas aos Erros I e II são: 


a = P [ Erro I ] = P 




<35 


i=l 


, sendo p = 0,80 


Logo a = P 


p 

£x, <34 

^P 

£x j <34,5 

= p 

x < 34,5 


_l =1 


_i=l 


50 . 


= P 


X -0,80 
/0,80 x 0,20 
50 


< 


34,5 

50 


0,80 


0,80x0,20 


50 


= P[Z<- 1,94] =0,0262 


(aproximando a Binomial por uma Normal) 

Isso significa que, mesmo que o curso da IES seja de boa qualidade, existiria uma 
chance de 2,62% de que, como resultado da regra estabelecida, ele infelizmente viesse a 
ser descredenciado. 


Analogamente, 

(3 = P [ Erro II 1 = P 


Logo P = P 


£x, >35 

i=l 


, sendo p = 0.60 


P 

Í35 

= P 

Vx, >34,5 

= P 

[x> 34 ' 5 l 


-•=1 


_í=l 


50 . 
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= P 


X -0,60 


> 


34,5 

50 


-0,60 


0,60x0,40 0,60x0,40 


50 


50 


= P[Z> 1,59] =0,0559 


Isso significa que, mesmo que o curso da IE5 seja de má qualidade, existiria uma 
chance de 5,59% de que, como resultado da regra estabelecida, ele erradamente fosse 
autorizado a continuar funcionando. 

8.6_R) Será que a taxa de inflação tende a ser mais baixa nos países mais ricos 
do que nos países mais pobres? 

Os diversos países do planeta foram divididos em dois grupos conforme o seu nível 
de renda per capita: 

Grupo A: renda per capita menor ou igual a 2.500 dólares 
Grupo B: renda per capita acima de 2.500 dólares 

A tabela a seguir contém amostras de países de cada um desses dois grupos, assim 
como a renda per capita e a taxa de inflação em cada um deles no ano de 2005. 

Conjunto de Dados 


País 

Rpcap 

Inflação 

País 

Rpcap 

Inflação 

Guiné-Bissau 

165,5 

107,38 

Polônia 

2735,4 

1 14,58 

Serra Leoa 

209,2 

135,93 

Sérvia 

2853,2 

330,05 

Vietnam 

226,9 

124,4 

Belize 

2876,6 

1 13,34 

Haiti 

244,6 

248,28 

Irã 

3003 

192,89 

Malawi 

257,8 

198,4 

Granada 

3022,7 

1 1 1,1 

Camboja 

322,3 

1 14,03 

S. Vicente e Granadinas 

3157,9 

108,81 

Mianmar 

335,6 

297,04 

África do Sul 

3344,8 

128,05 

Gâmbia 

362,6 

156,39 

Uruguai 

3569,6 

162,27 

Rep. Centro Africana 

363,6 

1 1 1,48 

Fed. Russa 

3583,7 

199,72 

Laos 

382,2 

163,06 

Santa Lucia 

3656,2 

II 1,98 

Benin 

417,1 

1 14,95 

México 

3878,6 

127,14 

Bangladesh 

435,5 

130,16 

Eslováquia 

421 1,5 

132,97 

Zâmbia 

439,9 

251,44 

Malásia 

4245,6 

108,99 

Burkina Fasso 

478,4 

1 16,03 

Chile 

4703,5 

1 13,64 

Nigéria 

493,2 

207,38 

Gabão 

5199,2 

104,85 

Ilhas Salomão 

51 1,7 

148,1 

S. Cristovão e Nevis 

5594,2 

1 10,98 

Paquistão 

599 

128,48 

Seichelles 

5830 

1 14,89 

India 

673,1 

121,54 

Arábia Saudita 

6999,6 

100,72 

Honduras 

735,4 

149,6 

Líbia 

7776,4 

80,25 

Sudão 

841,9 

145,46 

Trinidad e Tobago 

8553,5 

126,49 

Arménia 

860,2 

1 17,5 

Portugal 

9812,4 

1 16,89 

Bolívia 

874,1 

1 16,63 

Grécia 

12102 

1 18,15 

Filipinas 

875,8 

129,8 

Eslovênia 

12419,3 

130,59 

Guatemala 

1020,5 

142,79 

Chipre 

12528,3 

1 14,52 

Vanuatu 

1036,8 

1 1 1,72 

Barein 

12855,1 

104,86 
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País 

Rpcap 

Inflação 

Pais 

Rpcap 

Inflação 

Egito 

1062,9 

128,13 

Kuweit 

14297 

108,77 

Paraguai 

1 123 

150,87 

China, Macau 

15307,8 

99,02 

Butão 

1 146,2 

1 19,13 

Nova Zelândia 

16897,9 

113 

Camarões 

1225,4 

1 10,48 

Hong Kong 

20279,9 

93,38 

El Salvador 

1239,6 

1 18,02 

Itália 

23356,9 

1 12,71 

Equador 

1316 

175,86 

Qatar 

23515,8 

120,88 

Jordânia 

1504,9 

1 12,67 

Bélgica 

25869,5 

1 1 1,03 

Colômbia 

1607,2 

136,85 

Alemanha 

26387 

108,27 

Rep. Dominicana 

1657,6 

230,43 

Canadá 

27330,7 

1 12,17 

Tonga 

1819,3 

160,41 

Japão 

28325,8 

97,83 

Romênia 

1967,6 

231,6 

Estados Unidos 

30069,3 

II 3,41 

Cazaquistão 

221 1,5 

140,35 

Dinamarca 

34655,5 

1 10,22 

Tunísia 

2420,8 

1 13,75 

Suécia 

36834,5 

107,51 




Noruega 

39941,3 

109,06 


Fonte: Site da United Nations Statistics Division. 

Observação: A taxa de inflação é medida pelo índice de preços ao consumidor, ano 2000 = 100, segundo o FMI. 


Queremos comparar as taxas médias de inflação nesses dois grupos de países, atra¬ 
vés de um teste de hipótese em que: 

H 0 : p A = p B contra Hp p A > p B , 

sendo p A e p B as médias populacionais dessa variável em cada um dos grupos. 


Como os tamanhos de amostra m = 38 e n = 39 são ambos relativamente grandes, 


aqui pode ser usada a estatística de teste Z 


X-Y 



, cuja distribuição é aproxima- 


V m n 

damente uma Normal padrão sob a hipótese nula, mesmo quando as variâncias popula¬ 
cionais a 2 X e a 2 não são iguais - ver Considerações finais sobre o teste t não-pareado, na 
Subseção 8.8.1. 


a) Teste H 0 contra Hp ao nível a = 1%. 

b) Qual o nível crítico? 


Solução: 

a) A partir dos dados podem ser calculados: 


Grupo 

n o bs 

Média 

Desvio-padrão 

A: renda pc < 2500 

38 

150,435 

47,0537 

B: renda pc > 2500 

39 

122,974 

40,8135 


150,435-122,974 
1 47,0537 2 | 40,8135 2 
V 38 + 39 


2,733 


Então Z 
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Como z 099 = 2,33 < 2,733 = Z obs , H 0 deve ser rejeitada. 

Isso significa que, ao nível a = 1%, há evidências suficientes de que as taxas 
de inflação são em média mais baixas entre os países mais ricos (renda per capi¬ 
ta > 2500 dólares) do que entre os países mais pobres (renda per capita < 2.500 
dólares). 

b) O nível crítico aqui é igual à área sob a curva da Normal padrão e à direita de 
2,733, a saber, p-valor = 0,00314. O que você concluiria sobre o p-valor com 
base na Tabela 1? 


EXERCÍCIOS PROPOSTOS 

8.1_P) O conceito de nível crítico 

Quando se está testando a hipótese nula H 0 contra a hipótese alternativa H,, quais 
das seguintes afirmações sobre, o nível crítico (também chamado nível descritivo ou 
p-valor) é verdadeira? 

a) O p-valor é a probabilidade de que H 0 seja rejeitada, no caso de ela ser verda¬ 
deira. 

b) O p-valor é a estimativa da probabilidade de que H 0 seja falsa, obtida a partir dos 
dados. 

c) O p-valor é o menor nível de significância que ainda nos permitiria rejeitar H 0 à 
luz dos dados disponíveis. 

d) O p-valor é um conceito que depende do conjunto de dados coletados. 

e) O p-valor é a probabilidade de que H 0 seja aceita, quando ela é falsa. 

8.2_P) Checando conceitos básicos 

Se foi realizado um teste da hipótese nula H 0 contra a hipótese alternativa H t e, com 
base nos dados, H 0 foi aceita ao nível de significância de 5%, então quais das seguintes 
afirmações estão corretas e quais não estão? Por quê? 

a) H 0 também seria aceita ao nível de significância de 2%. 

b) H 0 é verdadeira. 

c) H () seria rejeitada ao nível de significância de 3%. 

d) Não se pode afirmar com certeza que H 0 é verdadeira ou que H 0 é falsa. 

e) A probabilidade de H 0 ser verdadeira é de 95%. 

8.3 P) Mais verificação de conceitos básicos 

Quando estamos formulando um problema de teste de hipótese: 

a) Cometero P.rro I é o mesmo que aceitar H,, quando H, é falsa. Sim ou não? Porquê? 

b) A soma das probabilidades dos Erros 1 e 11 é igual a 1. Sim ou não? Por quê? 

O O valoi observado da estatística de teste pode ser obtido através da consulta a 

uma tabela de probabilidades. Sim ou não? Por quê? 
d; () valoi do nível de significância pode ser escolhido arbitrariamente pelo pesqui¬ 
sador Sim ou não? Porque’ 
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8.4_P) Cálculo das probabilidades de erro com um modelo Normal 

Foram coletadas n = ò4 observações x,, x 2 ,x (v( de uma variável que se comporia se 
gundo uma lei Normal com média p e desvio-padrão a = 10. Sabe-se que o valor da me¬ 
dia populacional p é igual a 30 ou 35. Deseja-se então testar 11 0 : p = 30 contra II (J 35 
e, para isso, será usada a seguinte regra de decisão: 

Se a média amostrai x > 33, rejeitar H 0 

Caso contrário, aceitar H 0 

a ) Determine a = P[Erro 1]. 

b) Determine (3 = P[Erro II]. 

8.5_P) Testando hipóteses em uma eleição para governador 

Em uma pesquisa eleitoral referente ao primeiro turno de uma eleição para governa¬ 
dor foram ouvidos n = 1000 eleitores selecionados aleatoriamente, e, entre eles, m = 510 
declararam-se favoráveis ao candidato A. Deseja-se testar a hipótese EI 0 de que a propor¬ 
ção p de eleitores do candidato A é menor ou igual a 0,5 contra a alternativa de que A 
venceria direto, sem a necessidade do segundo turno. 

a) Qual seria a sua decisão ao nível de significância de 5%? Por quê? 

b) Se na realidade p = 0,55, qual seria a probabilidade de ser cometido o Erro II ao 
ser usada essa mesma regra de decisão? 

8.6_P) Discriminando entre dois tipos de minério 

O teor da substância S no minério M 0 se comporta como uma Normal de média 15% e 
desvio-padrão 10%, e o teor da substância S no minério se comporta como uma Nor¬ 
mal de média 20% e desvio-padrão 10%. A Companhia C dispõe de um volume apreciá¬ 
vel de um minério cuja natureza (M 0 ou é desconhecida. Como a substância S é de 
fato uma impureza indesejável, só interessa à Cia. C utilizar esse material no seu processo 
produtivo no caso de ele ser M 0 . Será então coletada uma amostra de n porções desse ma¬ 
terial que serão analisadas quimicamente e, com base nos resultados, se pretende testar. 

H 0 : o minério é M 0 

contra 

Hp o minério é M t 

a) Qual deve ser o tamanho n da amostra para que as probabilidades do Erro I e do 
Erro II sejam respectivamente de 0,01 e 0,10 ? 

b) Usando o n obtido em (a), qual a decisão a ser tomada se a média amostrai dos 
teores observados for x = 18? Justifique a sua resposta. 

8.7_P) Investigando a relação entre “tempo de sobrevida” e “grau de 
dissemelhança entre os tecidos do doador e do receptor” em um 
transplante de coração 

39 pacientes do Hospital da Universidade de Stanford, nos Estados Unidos, que se 
submeteram a transplante de coração tiveram seus dados médicos compilados. Com 
base nos dados disponíveis, foi montada a seguinte tabela de contingência: 
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Tempo de sobrevida 

Grau de dissemelhança 

Total 

Menor que 1 

Maior que 1 

Menos de 3 meses 

8 

17 

25 

3 meses ou mais 

6 

8 

14 

Total 

14 

25 

39 


Pretende-se usar o teste Qui-quadrado para verificar se existe independência entre o 
tempo t de sobrevida após o transplante e uma medida m do grau de dissemelhança entre 
os tipos de tecido do doador e do paciente (ou seja, uma medida de propensão à rejeição). 

a) Mostre que estão atendidas todas as condições exigidas para que se use o referi¬ 
do teste neste caso. 

b) Qual a sua conclusão ao nível de significância a = 5%? Por quê? 

8.8_P) Pesquisa sobre consumo cultural: programa preferido x faixa etária 

Foi realizada uma pesquisa de opinião em que n = 499 pessoas foram ouvidas a res¬ 
peito de suas preferências em termos de consumo cultural. Entre outras coisas, a cada 
uma dessas pessoas perguntou-se a sua faixa etária e qual entre quatro tipos de progra¬ 
ma era mais do seu agrado. Com base nesses dados foi montada a seguinte tabela de 
contingência, sendo os valores entre parênteses as freqüências esperadas sob indepen¬ 
dência (ver Exemplo 2.2): 


Faixa Etária 

Tipo de Programa 

Total 

cinema 

teatro 

shows musicais 

exposições 1 
dança 

entre 18 e 21 anos 

68 

(66,0962) 

15 

(21,01804) 

45 

(35,6754) 

10 

(15,21042) 

138 

entre 22 e 25 anos 

66 

(68,9699) 

21 

(21,93186) 

42 

(37,2265) 

15 

(15,87174) 

144 

entre 26 e 30 anos 

66 

(64,1804) 

24 

(20,40882) 

25 

(34,641 3) 

19 

(14,76954) 

134 

entre 31 e 40 anos 

39 

(39,7535) 

16 

(12,64128) 

17 

(21,4569) 

1 1 

(9,14830) 

83 

Total 

239 

76 

129 

55 

499 


a) O que pode se concluir sobre o nível crítico correspondente ao teste da hipótese 
de independência entre faixa etária e tipo de programa? Que conclusão se pode 
extrair sobre isso? 

b) Deseja-se lambem testar a hipótese nula H 0 dc que, entre os possíveis tipos de 
programa, no máximo 20% da população em questão dá preferência aos shows 
musicais, contra a alternativa de que esse percentual é superiora 20%. Qual o ní¬ 
vel crítico? Extraia conclusões. 
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8.9_P) Relação entre comprimento e largura do corpo das tartarugas 

Foi coletada uma amostra com n = 48 tartarugas e, para cada uma delas, foram medi 
dos o seu comprimento Cea sua largura L. Foram então definidas novas variáveis x 
ln(C) e y = ln(L), porque as distribuições de C e L são ambas muito assimétricas. 

Usando os dados sobre x e y para cada elemento da amostra, calculou-se então o cor 
ficiente de correlação amostrai entre essas duas variáveis, e o resultado obtido foi 0,977 
Em seguida foi testada a hipótese nula H 0 de que o coeficiente de correlação populacio¬ 
nal entre x e y é igual a 0 contra a hipótese alternativa H, de que ele é diferente de 0. H 
foi rejeitada ao nível de significância a = 1%. 

Foram então discretizadas as variáveis x e y da maneira mostrada a seguir, de modo a 
se obter a seguinte tabela de contingência: 


Classe de y 

Classe de x 

Total 

x < 4,8 

x > 4,8 

y <4,6 

24 

9 

33 

y >4,6 

0 

15 

15 

Total 

24 

24 

48 


Deseja-se agora testar H 0 : Há independência entre as variáveis “Classe de x” e “Clas¬ 
se de y” contra a alternativa Hp Há interdependência entre essas variáveis. 

a) Determine o nível crítico correspondente ao teste que se baseia na tabela de con¬ 
tingência anterior. Explicite o seu raciocínio. 

b) Há ou não coerência entre os resultados do teste de correlação referido e o do 
teste de independência que você acaba de realizar? Por quê? 

8. 10_P) Estatísticas de segurança no Brasil 

Os dados deste problema se referem ao número de presos em cada estado do Brasil, 
segundo estatísticas oficiais sobre a questão da segurança no país em 2001. A tabela de 
resultados a seguir contém: 

• o número de estados; 

• a média amostrai; 

• o desvio-padrão amostrai; 

correspondentes à variável v = log ]0 (número de presos), para as regiões Norte e Nor¬ 
deste. 


Região 

N- de Estados 

Média 

Desvio-padrão 

Norte (N) 

7 

4,7460 

0,61 13 

Nordeste (NE) 

9 

4,0828 

0,5235 


Observação: Foi usada a transformação logarítmica para fazer com que as variâncias 
correspondentes às duas regiões ficassem mais próximas entre si. 
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a) Teste a hipótese nula de médias iguais contra a hipótese alternativa de médias 
diferentes nas regiões Norte (N) e Nordeste (NE), ao nível de significância de 
5%, para a variável v = log I0 (n 5 de presos). Qual a sua conclusão? Por quê? 

b) O que se pode afirmar sobre o nível crítico neste caso? 

8.1 l_P) Testando hipóteses sobre a proporção de pessoas com nível superior 

Estima-se em 30% a proporção dos habitantes de certa localidade que têm curso supe¬ 
rior completo. Para testar tal hipótese, escolhe-se uma amostra aleatória de 15 habitantes. 
Se, dentre eles, houver de 2 a 7 (ambos os extremos incluídos) indivíduos com curso su¬ 
perior completo, aceitaremos a hipótese H 0 : p = 0,30. Caso contrário, ela será rejeitada em 
favor de Hp p * 0,30. 

a ) Determinar o nível de significância a do teste. 

b) Determinar (3 = P[Erro II], para a alternativa p = 0,2. 

c ) Determinar (3 = P[Erro II], para a alternativa p = 0,4. 

Observação: 

1. Note que para n = 15 não é adequado aproximar a Binomial por uma Normal. 
2- A tabela a seguir contém os valores de P(X < k), onde X ~ binomial(15;p), para 
(p = 0,2), (p = 0,3) e (p = 0,4) e para k variando desde 0 até 15: 


k 

P 

0,2 

0,3 

0,4 

0 

0,035184 

0,004748 

0,000470 

1 

0,167126 

0,035268 

0,005172 

2 

0,398023 

0,126828 

0,0271 14 

3 

0,648162 

0,296868 

0,090502 

4 

0,835766 

0,515491 

0,217278 

5 

0,938949 

0,721621 

0,403216 

6 

0,981941 

0,868857 

0,609813 

7 

0,995760 

0,949987 

0,786897 

8 

0,999215 

0,984757 

0,904953 

9 

0,999887 

0,996347 

0,966167 

10 

0,999988 

0,999328 

0,990652 

11 

0,999999 

0,999908 

0,998072 

12 

1 

0,999991 

0,999721 

13 

1 

0,999999 

0,999975 

14 

1 

1 

0,999999 

15 

1 

1 

1 
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8.I2_P) Comparando as notas dos alunos em uma mesma 
prova de Estatística aplicada a três cursos diferentes 

Em cada um de três cursos universitários (A, B e C), foram coletadas amostras alea¬ 
tórias de estudantes, tendo sido todos eles submetidos a uma mesma prova de conheci¬ 
mentos de Estatística. O objetivo era comparar entre si os resultados obtidos pelos 
alunos dos três cursos. Os resultados obtidos foram os seguintes: 


Curso 

Média 

Desvio-padrão 

Tara. Amostra 

A 

3,68 

0,33 

43 

B 

3,75 

0,38 

32 

C 

5,72 

0,27 

65 


Que conclusões podem ser extraídas? 









APÊNDICE I 


FUNDAMENTOS 

MATEMÁTICOS 


Para facilitar o entendimento do leitor, apresentamos a seguir um resumo bem sucinto 
das definições e resultados matemáticos usados neste livro. 


I. SOMATÓRIOS 

n 

• X a i = a i + a 2 + - + a„ 

i =1 

Exemplo: 

A partir dos dados x t , x 2 ,..., x n , calcula-se a variância da variável x pela expressão 



n -1 


(ver Capítulo 1) 


Então, se n = 5, x, = 3, x 2 = 5, x 3 = 0, x 4 = 2, x 5 = 6 , temos: 

5 

^x j = x, + x 2 + x 3 + x 4 + x 5 = 3 + 5 + 0 + 2 + 6 = 16 


£x 2 — Xj + x 2 +X 3 + x 2 + x 2 = 3 2 + 5 2 + O 2 + 2 2 + 6 2 = 9 + 25 + 0 + 4 + 36 = 74 


i=j 


74 _iC 74 _^ 


Logo, S 2 =-— 

5-1 


^-= 5,7 


I a , =a, + a 2 + a 3 +... 


1=1 


Observação: Em algumas situações consideradas neste livro, aparecem somatórios em 
que o número de parcelas é infinito. Esse assunto é estudado nos livros de Cálculo sob o 
título de Séries Numéricas. Por exemplo, ao calcularmos as médias e variâncias de al¬ 
gumas variaveis aleatórias discretas - como, por exemplo, no caso da distribuição de 
Poisson - as vezes temos somatórios infinitos. Mesmo quando o número de parcelas é 










272 ESTATÍSTICA BÁSICA 


ELSEVÍER 


infinito, é possível que o resultado da soma seja um número finilo e, nesse c aso, diz se 
que a série é convergente. Como essa discussão transcende o nível de aprofundamento 
matemático desta obra, não nos estenderemos mais sobre esse assunto. 

2. NOÇÕES DE ANÁLISE COMBINATÓRIA 

• Se n é um inteiro positivo, o fatorial de n é, por definição, 

n! = n . (n - 1) . (n - 2) ... 3.2 . 1 Por convenção, 0! = 1. 

Exemplo: 5! = 5x4x3x2xl = 120 

• Se n e k são inteiros positivos (n > k), então, combinações de n elementos k a k é 


7 n 3 

v k y 


n! 


Exemplo: 


k! (n — k)! 

773 


v 2 y 


n(n - l)(n-2)...(n-k + l) 
k! 

7! 


7! 


7x6x5x4x3x2xl 


7x6 


= 21 


2!(7 -2)! 2! x 5! (2 x 1) x (5 x 4 x 3 x 2 x 1) 

São propriedades das combinações as seguintes: 


7 n^ 

v°y 


7 n ^ 


v n y 


= 1 


7n3 í 
\ 


n 

v k y 


n 3 
n -k y 


7n3 7n-l3 7n-l3 
+ 

k-1 


v k y 


v j 


■ j 


\ 


A partir delas, se obtém o chamado Triângulo de Pascal, a saber, 


7(^ 

v° y 


(n 

m 


4, 


Í 2 1 

Í 2 1 

Í 2 1 


T, 



733733 


v°y 


v 1 / 


Í 3 1 

J-, 




vT 


í 4 ) 

Í 4 1 

Í 4 1 

Í 4 1 

743 
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Numericamente, temos: 

1 

1 1 
1 2 1 
13 3 1 
1 464 1 
1 5 10 10 5 1 
1 6 15 20 15 6 1 


Exemplos: 


<4 1 

_ A _ 

Í 4 1 


' 4 N 

, 3 , 

— 1 — 





' 3 N 


Í 3 l 


+ 


NJ 

1 

H- 1 


, 2 > 


=3+3=6= 


Í 4 1 

, 2 > 


Binômio de Newton: 


Se a e b são reais e n é um inteiro positivo, então (a + b) n = ^ 


n 


k=0 


vk, 


Exemplo: (2 + 3)'* = 


Í 4 1 


2°3 4 + 


f 4 ' 


2'3 3 + 


Í 4 1 

k 2 . 


2 2 3 2 + 


" 4 1 

,3, 


2 3 3 1 + 


„ki,n-k 

a b 


v 4 y 


2 4 3° = 


= 1x1x81 +4x2x27 + 6x4x9 + 4x8x3+lx 16x1 = 81 + 216 + 216+ 96+ 16 = 625 = 5 4 


3. MÓDULO DE UM NÚMERO REAL 

• Para qualquer número real x, o módulo ou valor absoluto de x, representado por 

|x|, é 



Exemplo: l-4|=|4| = 4 

• Algumas regiões da reta real, especificadas em termos de módulo: 
Dados os números reais a e k, onde k > 0, 
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Dizemos que |x| < k, se - k < x < k 



> 


Dizemos que |x|> k, se x > k ou x < -k 



> 


k 


■k 


0 


Dizemos que |x - a| < k, sea-k<x<a + k 



a-k a a+k 

Dizemos que |x - a| > k, se x > a + k ou x < a - k 



*■ 


k 


a+k 


4. FUNÇÃO 

• Dados os conj untos A e B, dizemos que f é uma função de A em B se, a cada elemen¬ 
to x de A corresponde um único elemento y = f(x) de B. 


B 



í> 



• Uma função real de variável real é uma regra f que associa a cada número real 
x, pertencente a um certo intervalo 1 de números reais, um número real y = 
f(x). É usual representarmos uma tal função por seu gráfico no plano bidimen¬ 
sional. 
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Exemplos: 

4.1 - A função f definida por f(x) = |x|,para todo x entre-10 e +10 tem como gráfico: 




4.2-A função g definida por g(p) = p(l-p), para todo p entre 0 e 1 tem como gráfico: 


g(p) = p(l -p) 



5. O NÚMERO “e” E A FUNÇÃO EXPONENCIAL 

• O número e é um dos números irracionais mais usuais na Matemática. Ele tem 
uma expansão infinita no sistema decimal: e = 2,718... Além disso, pode ser calcu¬ 
lado como o resultado de um somatório infinito (série convergente): 

1111 , , 1 1 

e = — 4-1 4 F...— 1 4 I -t-1-F... 

0! 1! 2! 3! 26 
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• A função exponencial é definida por 

exp (x) = e\ para todo x real 
Seu gráfico é o seguinte: 





Exemplo de uso da função exponencial: 

1 ( 

Conforme o Capítulo 4, a função definida por <p(z) = -_ exp 

V27t V 

real, é a função densidade da Normal padrão e tem como gráfico: 



\ 


, para todo z 


y 



- 4 - 3 - 2-10 12 3 4 


Observação: O símbolo n usado é o número irracional 3,141592..., cuja definição vem 
da Geometria. 
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6. LOGARITMOS 

• Se a é um número real positivo, então para qualquer número x real e positivo, o lo¬ 
garitmo de x na base a é definido por y = log a x, tal que x = a>. 

• Mudança de base: 

Para passar do log na base a para o log na base b, usamos a expressão: 
iogb* , 1 

lo g a x loga b 

• Log neperiano e log decimal 

As duas bases mais usuais na Matemática são a base 10, que dá origem aos chama¬ 
dos logaritmos decimais, e a base e, que dá origem aos chamados logaritmos ne- 
perianos. Podemos então definir as funções f e g tais que 

f(x) = log 10 x e g(x) = ln x = = log c x, para todo x > 0 

Como lnlO = 2,3026, temos ln x = 2,3026 log )0 x, para todo x > 0. 

Os gráficos das funções log neperiano e log decimal são: 









Tabelas de probabilidade 


TABELA I: DISTRIBUIÇÃO NORMAL PADRÃO ACUMULADA 



Fornece <t>(z p ) = P(-oo < Z < z p ), para todo Zp, de 0,01 em 0,01, desde z p - 0,00 até z p - 3,59 

A distribuição de Z é Normal(0; I) 


Zp 

0,00 

0,01 

0,02 

0,03 

0,04 

0,05 

0,06 

0,07 

0,08 

0,09 

0,0 

0,5000 

0,5040 

0,5080 

0,5120 

0,5160 

0.5199 

0,5239 

0,5279 

0,5319 

0.5359 

0.1 

0,5398 

0,5438 

0,5478 

0,5517 

0,5557 

0,5596 

0,5636 

0,5675 

0,5714 

0,5753 

0.2 

0,5793 

0,5832 

0,5871 

0,5910 

0,5948 

0,5987 

0,6026 

0,6064 

0,6103 

0,6141 

0.3 

0,6179 

0,6217 

0,6255 

0,6293 

0,6331 

0,6368 

0,6406 

0,6443 

0,6480 

0,6517 

0,4 

0,6554 

0,6591 

0,6628 

0,6664 

0,6700 

0,6736 

0.6772 

0,6808 

0,6844 

0,6879 

o.s 

0,6915 

0,6950 

0,6985 

0,7019 

0,7054 

0,7088 

0,7123 

0,7157 

0.7190 

0,7224 

0.6 

0,7257 

0,7291 

0,7324 

0,7357 

0,7389 

0,7422 

0,7454 

0,7486 

0,7517 

0,7549 

0.7 

0,7580 

0,7611 

0,7642 

0,7673 

0,7704 

0,7734 

0,7764 

0,7794 

0,7823 

0,7852 

0,8 

0,7881 

0,7910 

0,7939 

0,7967 

0,7995 

0,8023 

0,8051 

0,8078 

0,8106 

0,8133 

0,9 

0,8159 

0,8186 

0,8212 

0,8238 

0,8264 

0,8289 

0,8315 

0,8340 

0,8365 

0,8389 

1,0 

0,8413 

0,8438 

0,8461 

0,8485 

0,8508 

0,8531 

0,8554 

0,8577 

0,8599 

0,8621 

l.l 

0.8643 

0,8665 

0,8686 

0,8708 

0,8729 

0,8749 

0,8770 

0,8790 

0,8810 

0,8830 

1.2 

0,8849 

0.8869 

0,8888 

0,8907 

0,8925 

0,8944 

0,8962 

0,8980 

0.8997 

0,9015 

1.3 

0,9032 . 

0,9049 

0,9066 

0,9082 

0,9099 

0,91 15 

0,9131 

0,9147 

0,9162 

0,9177 

1.4 

0,9192 

0,9207 

0,9222 

0,9236 

0,9251 

0,9265 

0,9279 

0,9292 

0,9306 

0,9319 

1.5 

0,9332 

0,9345 

0,9357 

0,9370 

0,9382 

0,9394 

0,9406 

0,9418 

0,9429 

0,9441 

1.6 

0,9452 

0.9463 

0,9474 

0,9484 

0,9495 

0,9505 

0,9515 

0,9525 

0,9535 

0,9545 

1.7 

0,9554 

0,9564 

0,9573 

0,9582 

0,9591 

0,9599 

0,9608 

0,9616 

0,9625 

0,9633 

1.8 

0,9641 

0,9649 

0,9656 

0,9664 

0,9671 

0,9678 

0,9686 

0,9693 

0,9699 

0,9706 

1.9 

0,9713 

0,9719 

0,9726 

0,9732 

0,9738 

0,9744 

0,9750 

0,9756 

0,9761 

0,9767 

2.0 

0,9772 

0,9778 

0,9783 

0,9788 

0,9793 

0,9798 

0,9803 

0,9808 

0,9812 

0,9817 

2,1 

0,9821 

0,9826 

0,9830 

0,9834 

0,9838 

0,9842 

0,9846 

0,9850 

0,9854 

0.9857 

2.2 

0,9861 

0,9864 

0,9868 

0,9871 

0,9875 

0,9878 

0,9881 

0,9884 

0.9887 

0.9890 

2,3 

0,9893 

0,9896 

0,9898 

0,9901 

0,9904 

0,9906 

0,9909 

0,991 1 

0,9913 

0,9916 

2.4 

0,9918 

0,9920 

0.9922 

0,9925 

0,9927 

0,9929 

0,9931 

0,9932 

0.9934 

0,9936 

2,5 

0,9938 

0,9940 

0,9941 

0,9943 

0,9945 

0.9946 

0,9948 

0,9949 

0,9951 

0,9952 

2,6 

0,9953 

0,9955 

0,9956 

0,9957 

0,9959 

0.9960 

0,9961 

0.9962 

0.9963 

0,9964 

2.7 

0,9965 

0,9966 

0,9967 

0,9968 

0,9969 

0,9970 

0,9971 

0,9972 

0,9973 

0.9974 

2.8 

0,9974 

0,9975 

0,9976 

0,9977 

0,9977 

0,9978 

0,9979 

0,9979 

0,9980 

0,9981 

2,9 

0,9981 

0,9982 

0,9982 

0,9983 

0.9984 

0,9984 

0,9985 

0,9985 

0,9986 

0.9986 

3.0 

0,9987 

0,9987 

0,9987 

0,9988 

0,9988 

0,9989 

0,9989 

0,9989 

0,9990 

0,9990 

3.1 

0,9990 

0,9991 

0,9991 

0,9991 

0,9992 

0,9992 

0,9992 

0,9992 

0.9993 

0,9993 

3,2 

0,9993 

0,9993 

0,9994 

0,9994 

0,9994 

0,9994 

0,9994 

0,9995 

0,9995 

0,9995 

3.3 

0,9995 

0.9995 

0,9995 

0,9996 

0,9996 

0,9996 

0,9996 

0.9996 

0,9996 

0.9997 

3.4 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0,9997 

0.9998 

3,5 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0,9998 

0.9998 

0.9998 

0.9998 

0,9998 


Obs.: Se Zp < 0, então <D(z p ) = P(-oo < Z < Zp) - I - <t>( Zp). 
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TABELA II: DISTRIBUIÇÃO T DE STUDENT 



Fornece o quantil tp em função do n2 de g.l. v (linha) e de p = P(T<tp) (coluna) 
T tem distribuição t de Student com v g.l. 


p 

v 

0,6 

0,7 

0,8 

0,9 

0,95 

0,975 

0,98 

0,99 

0,995 

1 

0,325 

0,727 

1,376 

3,078 

6,314 

12,706 

15,895 

31.821 

63,657 

2 

0,289 

0,617 

1,061 

1,886 

2,920 

4,303 

4,849 

6,965 

9,925 

3 

0,277 

0,584 

0,978 

1,638 

2,353 

3,182 

3,482 

4,541 

5,841 

4 

0,271 

0,569 

0,941 

1,533 

2,132 

2,776 

2.999 

3,747 

4,604 

5 

0,267 

0,559 

0,920 

1,476 

2,015 

2,571 

2,757 

3,365 

4.032 

6 

0,265 

0,553 

0,906 

1,440 

1,943 

2,447 

2,612 

3,143 

3,707 

7 

0,263 

0,549 

0,896 

1,415 

1,895 

2,365 

2,517 

2.998 

3,499 

8 

0,262 

0,546 

0,889 

1,397 

1,860 

2,306 

2,449 

2,896 

3.355 

9 

0,261 

0,543 

0,883 

1,383 

1,833 

2,262 

2,398 

2,821 

3.250 

10 

0,260 

0,542 

0,879 

1,372 

1,812 

2,228 

2,359 

2,764 

3,169 

1 1 

0,260 

0,540 

0.876 

1,363 

1,796 

2,201 

2,328 

2,718 

3,106 

12 

0,259 

0,539 

0,873 

1,356 

1,782 

2,179 

2,303 

2,681 

3,055 

13 

0,259 

0,538 

0,870 

1,350 

1,771 

2,160 

2,282 

2,650 

3,012 

14 

0,258 

0,537 

0,868 

1,345 

1,761 

2,145 

2,264 

2,624 

2,977 

IS 

0,258 

0,536 

0,866 

1,341 

1,753 

2,131 

2,249 

2,602 

2,947 

16 

0,258 

0,535 

0,865 

1,337 

1,746 

2,120 

2.235 

2,583 

2,921 

17 

0,257 

0,534 

0,863 

1,333 

1,740 

2.1 10 

2,224 

2,567 

2,898 

18 

0,257 

0,534 

0,862 

1,330 

1,734 

2,101 

2,214 

2,552 

2,878 

19 

0,257 

0,533 

0,861 

1,328 

1,729 

2,093 

2,205 

2,539 

2,861 

20 

0,257 

0,533 

0,860 

1,325 

1,725 

2,086 

2,197 

2,528 

2,845 

21 

0,257 

0,532 

0,859 

1,323 

1,721 

2,080 

2,189 

2,518 

2,831 

22 

0,256 

0,532 

0,858 

1,321 

1,717 

2,074 

2,183 

2,508 

2,819 

23 

0,256 

0,532 

0,858 

1,319 

1,714 

2,069 

2,177 

2,500 

2,807 

24 

0,256 

0,531 

0,857 

1,318 

1,711 

2,064 

2.172 

2,492 

2,797 

25 

0,256 

0,531 

0,856 

1,316 

1,708 

2,060 

2,167 

2.485 

2.787 

26 

0,256 

0,531 

0,856 

1,315 

1,706 

2,056 

2,162 

2,479 

2,779 

27 

0,256 

0,531 

0,855 

1,314 

1,703 

2,052 

2,158 

2,473 

2,771 

28 

0,256 

0,530 

0,855 

1,313 

1,701 

2,048 

2,154 

2,467 

2,763 

29 

0,256 

0,530 

0,854 

1,311 

1,699 

2,045 

2,150 

2,462 

2,756 

30 

0,256 

0,530 

0.854 

1,310 

1,697 

2,042 

2.147 

2,457 

2,750 

40 

0,255 

0,529 

0,851 

1,303 

1,684 

2,021 

2,123 

2,423 

2,704 

60 

0,254 

0,527 

0,848 

1,296 

1,671 

2,000 

2,099 

2,390 

2,660 

120 

0.254 

0,526 

0,845 

1,289 

1,658 

1,980 

2,076 

2,358 

2,617 

X 

0,253 

0,524 

0.842 

1,282 

1,645 

1,960 

2,054 

2,326 

2,576 


Observação: Para um certo v fixado, se p < 0.50, tp = t,. p . 
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TABELA III: DISTRIBUIÇÃO F DE FISHER-SNEDECOR 



Fornece os quantis F 0.95 (em cima) e F 0.99 (embaixo) em função do n 2 de g.l. numerador V| (coluna) e do n 2 de g.l. denominador v 2 (linha) 
F tem distribuição F com V| g.l. no numerador e v 2 g.l. no denominador P( F < F 0 i 9 s) = 0,95 e P( F < F 0 , 99 ) = 0,99 


v l 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

20 

40 

60 

120 

X 

1 

161.45 

199.50 

215.71 

224.58 

230 . 16 

233.99 

236.77 

238.88 

240.54 

241.88 

248.01 

251.14 

252.20 

253.25 

254,3 i 

4052.18 

4999.50 

5403.35 

5624.58 

5763.65 

5858.99 

5928.36 

5981.07 

6022.47 

6055.85 

6208.73 

6286.78 

6313.03 

6339.39 

/^/p *7/ 
OJÒD. , D 

2 

18,51 

19.00 

19.16 

19.25 

19.30 

19,33 

19.35 

19.37 

19.38 

19.40 

19.45 

19.47 

19,48 

19.49 

1930 I 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 

99,40 

99.45 

99.47 

99.48 

99.49 

9930 

3 

10.13 

9.55 

9.28 

9,12 

9.01 

8.94 

8.89 

8.85 

8.81 

8.79 

8.66 

8.59 

8.57 

8.55 

8.53 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.49 

27.35 

27.23 

26.69 

26.4 i 

26.32 

26.22 

"‘6 13 

4 

7.71 

6,94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

5.96 

5.80 

5.72 

5.69 

5.66 

5.63 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 

14.55 

14.02 

13.75 

13.65 

13.56 

1 3 . 4 c 

5 

6.61 

5,79 

5.41 

5.19 

5.05 

4,95 

4.88 

4.82 

4.77 

4,74 

4.56 

4,46 

4.43 

4.40 

4.37 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 

10.05 

9.55 

9.29 

9.20 

9.1 1 

9.02 

6 

5.99 

5.14 

4,76 

4.53 

4.39 

4.28 

4,21 

4,15 

4.10 

4.06 

3.87 

3.77 

3.74 

3,70 

3.67 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7.87 

7.40 

7,14 

7.06 

6.97 

c Aâ 

7 

5,59 

4,74 

4,35 

4.12 

3,97 

3,87 

3.79 

3,73 

3.68 

3.64 

3,44 

3.34 

3.30 

3.27 

3.23 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

6.62 

6.16 

5.91 

5,82 

5.74 

5.65 

8 

5,32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

139 

3.35 

3.15 

3.04 

3.01 

2.97 

293 

1 1.26 

8.65 

7.59 

7,01 

6.63 

6.37 

6.18 

6.03 

5.91 

5.81 

5.36 

5,12 

5.03 

4.95 

4.86 

9 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3,23 

3.18 

3.14 

2,94 

2.83 

2.79 

175 

i 71 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5,35 

5.26 

4.81 

4.57 

4.48 

4.40 

-=*- 

10 

4.96 

4.10 

3.71 

3,48 

123 

3.22 

U .1 

3.07 

3.02 

2.98 

2.77 

2.66 

2.62 

158 

2 54 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

4.85 

4.41 

4 . 1 / 

4.08 

4.0C 

39i 

20 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

2.35 

2.12 

1.99 

1.95 

.>0 

84 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

3.37 

2.94 

2.69 

2.61 

2.52 

747 

40 

4.08 

3.23 

2.84 

lá! 

2.45 

2.34 

2.25 

2.18 

2.12 

2.08 

1.84 

1.69 

1 ,ò4 

I.5S 

131 

7.31 

5.18 

4,31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

2.80 

2.37 

2.1 1 

102 

1 v$2 

Q I 

60 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

1.99 

1.75 

1.59 

1.53 

1 4' 


7.08 

4.98 

ÜJ 

3.65 

3.34 

112 

2.95 

2.82 

172 

2.63 

2.20 

1.94 

1.84 

■*3 


120 

3.92 

3.07 

2.68 

2.45 

2,29 

2.18 

2.09 

2.02 

1.96 

1.91 

1.66 

1.50 

1.43 

I 'S 


6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 

2.47 

2.03 

1.76 

1 .DO 

1 N 3 


00 

3.84 

3.00 

2,61 

2.37 

2.21 

2.10 

10 ! 

1.94 

1.88 

1.83 

1.57 

1.39 



' 1 


6,64 

4.61 

3.78 

112 

3.02 

2,80 

2.64 

2.51 

2.41 

2,32 

1.88 

1.59 

1 - 

1 1.47 

-íí— 



Observação: O quantil F p correspondente a v, g.l. no numerador e Vj g.l. no denominador coincide com o inverso do quantil F, ,, correspondente v v 
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TABELA IV: DISTRIBUIÇÃO QUI-QUADRADO 



Fornece o quantil x p em função do n 2 de g.l. v (linha) e de p = P(% 2 < x p ) (coluna), y} tem distnbuição qui-quadrado com v g.l. 


p 

' \ 

0,005 

0,010 

0,025 

0,050 

0,100 

0,250 

0,500 

0,750 

0,900 

0,950 

0,975 

0,990 

0,995 

1 

0.000 

0.000 

0.001 

0.004 

0.016 

0.102 

0.455 

1.323 

2.706 

3.841 

5.024 

6.635 

7.879 

2 

0.010 

0.020 

0.051 

0.103 

0.211 

0.575 

1.386 

2.773 

4.605 

5.991 

7.378 

9.210 

10.597 

3 

0.072 

0.115 

0.216 

0.352 

0.584 

1.213 

2.366 

4.108 

6.251 

7.815 

9.348 

11.345 

12.838 

4 

0.207 

0.297 

0.484 

0.71 1 

1.064 

1.923 

3.357 

5.385 

7.779 

9.488 

11.143 

13.277 

14.860 

S 

0.412 

0.554 

0.831 

1.145 

1.610 

2.675 

4.351 

6.626 

9.236 

11.070 

12.833 

15.086 

16.750 

6 

0.676 

0.872 

1.237 

1.635 

2.204 

3.455 

5.348 

7.841 

10.645 

12.592 

14.449 

16.812 

18.548 

7 

0.989 

1.239 

1.690 

2.167 

2.833 

4.255 

6.346 

9.037 

12.017 

14.067 

16.013 

18.475 

20.278 

8 

1,344 

1.646 

2.180 

2.733 

3.490 

5.071 

7.344 

10.219 

13.362 

15.507 

17.535 

20.090 

21.955 

9 

1.735 

2.088 

2.700 

3.325 

4.168 

5.899 

8.343 

11.389 

14.684 

16.919 

19.023 

21.666 

23.589 

10 

2.156 

2.558 

3.247 

3.940 

4.865 

6.737 

9.342 

12.549 

15.987 

18.307 

20.483 

23.209 

25.188 

1 1 

2.603 

3.053 

3.816 

4.575 

5.578 

7,584 

10.341 

13.701 

17.275 

19.675 

21.920 

24.725 

26.757 

12 

3.074 

3.571 

4.404 

5.226 

6.304 

8.438 

1 1.340 

14.845 

18.549 

21.026 

23.337 

26.217 

28.300 

13 

3.565 

4,107 

5.009 

5.892 

7.042 

9,299 

12.340 

15,984 

19.812 

22.362 

24.736 

27.688 

29,819 

14 

4.075 

4.660 

5.629 

6.571 

7.790 

10.165 

13.339 

17.117 

21.064 

23.685 

26.119 

29.141 

31.319 

15 

4.601 

5.229 

6.262 

7,261 

8.547 

11.037 

14.339 

18.245 

22.307 

24.996 

27.488 

30.578 

32.801 

16 

5.142 

5.812 

6.908 

7.962 

9.312 

11.912 

15.338 

19.369 

23.542 

26.296 

28.845 

32.000 

34.267 

17 

5.697 

6.408 

7.564 

8.672 

10.085 

12.792 

16.338 

20.489 

24.769 

27.587 

30.191 

33.409 

35.718 

18 

6.265 

7.015 

8.231 

9.390 

10.865 

13.675 

17.338 

21.605 

25.989 

28.869 

31.526 

34.805 

37.156 

19 

6.844 

7.633 

8.907 

10.117 

1 1.651 

14.562 

18.338 

22.718 

27.204 

30.144 

32.852 

36.191 

38.582 

20 

7,434 

8.260 

9.591 

10.851 

12.443 

15.452 

19.337 

23.828 

28.412 

31.410 

34.170 

37.566 

39.997 

21 

8.034 

8.897 

10.283 

11.591 

13.240 

16.344 

20.337 

24.935 

29.615 

32.671 

35.479 

38.932 

41.401 

22 

8.643 

9.542 

10.982 

12.338 

14 . 041 

17.240 

21.337 

26.039 

30.813 

33.924 

36.781 

40.289 

42.796 

23 

9.260 

10.196 

11.689 

13 . 091 

14.848 

18.137 

22.337 

27.141 

32.007 

35.172 

38.076 

41.638 

44.181 

24 

9.886 

10.856 

12.401 

13.848 

15.659 

19.037 

23.337 

28 . 241 

33.196 

36.415 

39.364 

42.980 

45.559 

25 

10.520 

1 1.524 

13.120 

14.611 

16.473 

19.939 

24.337 

29.339 

34.382 

37.652 

40.646 

44.314 

46.928 

26 

1 1.160 

12.198 

13.844 

15.379 

17.292 

20.843 

25.336 

30.435 

35.563 

38.885 

41.923 

45.642 

48.290 

27 

11.808 

12.879 

14.573 

16.151 

18.114 

21.749 

26.336 

31.528 

36.741 

40.113 

43.195 

46.963 

49.645 

28 

12.461 

1 3.565 

15.308 

16.928 

18.939 

22.657 

27.336 

32.620 

37.916 

41.337 

44.461 

48.278 

50.993 

29 

13.121 

14.256 

16.047 

17.708 

19.768 

23.567 

28.336 

33.711 

39.087 

42.557 

45.722 

49.588 

52.336 

30 

13.787 

14.953 

16.791 

18.493 

20.599 

24.478 

29.336 

34.800 

40.256 

43.773 

46.979 

50.892 

53.672 

40 

20.707 

22.164 

24.433 

26.509 

29.051 

33.660 

. 39.335 

45.616 

51.805 

55.758 

59.342 

63.691 

66.766 

50 

27.991 

29.707 

32.357 

34.764 

37.689 

42.942 

49.335 

56.334 

63.167 

67.505 

71.420 

76.154 

79.490 

60 

35.534 

37.485 

40.482 

43.188 

46.459 

52.294 

59.335 

66.981 

74.397 

79.082 

83.298 

88.379 

91.952 

70 

43.275 

45.442 

48.758 

51.739 

55.329 

61.698 

69.334 

77.577 

85.527 

90.531 

95.023 

100.425 

104.215 

80 

51.172 

53.540 

57.153 

60.391 

64.278 

71.145 

79.334 

88.130 

96.578 

101.879 

106.629 

112.329 

116.321 

90 

59.196 

61.754 

65.647 

69.126 

73.291 

80.625 

89.334 

98.650 

107.565 

113.145 

118.136 

124.116 

128.299 

100 

67.328 

70.065 

74.222 

77.929 

82,358 

90.133 

99.334 

109.141 

118.498 

124.342 

129.561 

135.807 

140.169 

















































































GLOSSÁRIO 


Símbolo ou 
Abreviatura 

Conceito 

Seção(*) 

a 

nível de significância ou prob. do Erro 1 

8.1 

â 

nível crítico ou p-valor 

8.5 

P 

prob. do Erro 11 

8.1 

B(.) 

viés de um estimador 

7.5 

Cov(.,.) 

covariância populacional 

5.1 

CV(.) 

coeficiente de variação populacional 

4.3 

CV 

coeficiente de variação amostrai 

1.6 

DIQ 

distância interquartil 

1.6 

DP(.) 

desvio-padrão de uma variável aleatória 

4.3 

H(.) 

média ou esperança de uma variável aleatória 

4.3 

EQM(.) 

erro quadrático médio de um estimador 

7.5 

f(.) 

função densidade de probabilidade 

4.4 

F(.) 

função de distribuição acumulada 

4.3 

F(.,.) 

função de distribuição acumulada conjunta 

5.1 

F 

F de Fisher-Snedecor (distrib. de probabilidade) 

8.9 

f p 

quantil p da distribuição F 

8.9 

FDA 

Função de distribuição acumulada 

4.3 

O 

Função de distr. acumulada da Normal padrão 

4.5 

<P 

função densidade da Normal padrão 

4.5 

g 1 

graus de liberdade 

7.7 

Ho 

hipótese nula 

8.1 

H, 

hipótese alternativa 

8.1 

iid 

independentes e identicamente distribuídas (v.a.s) 

5.2 

MS 

média de quadrados 

8.9 


média populacional 

6.1 
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ELSEVtER 

Símbolo ou 


Abreviatura 

Conceito 

Seção(*) 

N(p;a 2 ) 

distribuição Normal de média p e variância cr 2 

4.5 

N(0;1) 

distribuição Normal padrão 

4.5 

N 

tamanho da população 

6.3 

n 

tamanho da amostra 

6.3 

V 

n° de graus de liberdade 

7.7 

n 

espaço amostrai 

3.1 

p(.) 

probabilidade 

3.1 

p(.|.) 

probabilidade condicional 

3.3 

p 

proporção populacional 

7.4 

A 

P 

proporção amostrai 

7.4 

P(-) 

função de probabilidade 

4.3 

P(-v) 

função de probabilidade conjunta 

5.1 

Ql 

primeiro quartil 

1.6 

Q2 

segundo quartil ou mediana amostrai 

1.6 

Q3 

terceiro quartil 

1.6 

r xy 

coeficiente de correlação amostrai 

2.2 

S 

desvio-padrão amostrai 

1.6 

S 2 

variância amostrai 

1.6 

Sxy 

covariância amostrai 

2.2 

SS 

soma de quadrados 

8.9 

a 

desvio-padrão populacional 

4.4 

a 2 

variância populacional 

4.4 

t 

t de Student (distribuição de probabilidade) 

7.7 

*T> 

quantil p da distribuição t de Student 

7.7 

TCL 

Teorema Central do Limite 

6.1 

0 

parâmetro a ser estimado 

7.1 

/A 

0 

estimador de 0 

7.1 

v.a. 

variável aleatória 

4.1 

Var(.) 

variância de uma variável aleatória 

4.3 

X 2 

qui-quadrado (distribuição de probabilidade) 

8.10 

Xp 

quantil p da distribuição qui-quadrado 

8.10 

X 

média amostrai 

1.5 

z 

variável aleatória com distribuição Normal padrão 

4.5 

Z P 

quantil p da distribuição Normal padrão 

4.5 

(*) Número da secao em que o conceito aparece pela primeira vez 
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Observação: Este glossário deve ser usado pelo leitor somente como uma ajuda para 
orientá-lo quando estiver diante de um símbolo (ou de uma abreviação) que ele não 
está conseguindo identificar. Isso não quer dizer que outros símbolos também náo te¬ 
nham sido usados para representar o mesmo conceito. Por exemplo, também foram 
usados neste livro: 

• m, para simbolizar o tamanho de uma amostra 

• y, para simbolizar uma média amostrai 

• etc. 

Por outro lado, também pode ocorrer de ocasionalmente ser usado o mesmo símbolo 
para representar conceitos diferentes. Por exemplo, a letra N também foi usada no Ca¬ 
pítulo 8 para representar a soma dos tamanhos das amostras. 
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RESPOSTAS DOS 
EXERCÍCIOS PROPOSTOS 


Capítulo 1 

1.2_P) (a)F (b)F (c)F (d)V (e)F. 

1.3_P) (a) Turma = 38, Acima de 6: 23, Abaixo de 4:3 (b) Q1 = 5,3 Q2 = 6,3 Q3 = 7,1 
1.5_P) (b) média = 377,846; desvio-padrão = 156,314 
1.6_P) (a)V (b)F (c)F (d)F (e)F. 

1.7_P) (a) média = 30,504 desvio-padrão = 6,441 b) 72,04% c) mediana= 26,819 DIQ= 
4,218 

1.8_P) (a) média = 44,3785 desvio-padrão = 62,9669 b) Apenas o Rio de Janeiro. 0 Os 
três box-plots ficaram assimétricos, apresentando, porém, maior simetria o box-plot do 
log da variável. 

1.9_P)x = 56,334, s = 32,246, Ql= 32,250, Q3 = 72,756, DIQ = 40,506 
(x - 3s, x +3s) = (-40,4; 153,1) (Q1-1,5D1Q; Q3+l,5DlQ)=(-28,5; 133,5) 

Raposo e São João são pontos discrepantes pelos dois critérios. 

Capítulo 2 

2.2_P) (a) 20% (b) 32/60 ou 53,33% 

2.4_P) (a) V (b) F (c) F (d)F (e)F 

2.5_P) (a) x = l,801m, s = 0,109m (b) x = 76,75kg; s = 23,33kg 

(c) r = 0,403, reta: peso = 86,325 x altura - 78,742 

(d) r = 0,903 reta: peso = 101,350 x altura - 113,149 
2.6_P) (a) r = 0,837; b) Prof = 0,088 x Alunos + 89,546 
2.7_P) (a) V (b) F (c) F (d) F 

2.8_P) (a) r = 0,961 (b) a= 3,036; b= 8,546 (c) 113,88 

2.9_P) (b) Com SP: 0,955 Sem SP: 0,902 

Capítulo 3 

3.2_P) (a) 50% (b) 16,67% (c) 16,67% (d) 50% 

3.3_P) 0,145 
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3.4_P) (a) p(l - q) + q(l - p) ( b) (1 — p)(l - q) 

3.5JP) 53,57% 

3.6_P) (a) 0,879 (b) 17,576 

3.7_P) (a) P(B) = 0,38 P(R) = 0,32 P(F) = 0,30 

3.8_P) (a) 72% (b) 75% 

3.9_P) (a) 83,05% (b) 99,47% 

3.10_P) (a) 53,75% (b) 13,51% (c) 32,43% (d) 54,06% 

Capítulo 4 

4.2_P) (a) Sim (b) R$60,00 (c) R$35,55 

4.3_P) (a) p(0) = 0,060; p(l) = 0,156; p(2) = 0,280; p(3) = 0,504 (b) E(X) = 2,228 
DP(X) = 0,921 

4.4_P) (a) A (b) A (c) 17% e 13% 

4.5JP) 38,28% 

4.7_P) (a) 2 chegadas (b) 54,43% 

4.8_P) (a) 86,47% (b) 58,68 minutos 
4.9_P) (a) 194,9 cm (b) 0,2276 
4.10_P) (a) 0,9876 (b) 0,7134 

Capítulo 5 
5.1_P) 33,61% 

5.3_P) (a) 44,70% (b) 54,05% 

5.4JP) (a) 0,130 (b) 0,00188 (c) 0,818 

5.5_P) 0,704 
5.7_P) 20,16% 

5.8_P) (a) 4,42% (b) 41,15% 

Capítulo 6 

6.1_P) (a) 3,00% (b) 95,68% 

6.2_P) 30,85% 

6.3_P) (a) 14,16% (b) 0,0526 

6.4_P) (a) 8,65% (b) 78,91% (c) 12,44% 

6.6_P) 17,43% 

Capítulo 7 

7.3_P) (a) 6,65 (b) (5,61 ; 7,69) 

(c) Para d <0,1 ez 095 = 1,645, n> 1083 ; Parad<0,01 ez 095 = 1,645 , n> 108241. 

(d) Substituiria o desvio-padrão populacional, a, pelo desvio-padrão amostrai, S, e o 
quantil da distribuição Normal pelo quantil da distribuição t de student com (n - 1) 
grau de liberdade. 

7.4 P) (a) X =141,2; S = 3,6 ; mediana amostrai = 141,5 (b) (139,3 ; 143,1) 

(c) Admitindo que S = 3,6 e que n é suficientemente grande de forma que o quantil da 
dist. t se aproxima do quantil da dist. Normal (ver obs. do enunciado): n = 338. 

7.5_P) (a) (66,19 ; 71,21) (b) Maior nível de confiança é 0,90 e (67,41 ; 71,19) 
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7.7_P) (a)48 (b) 715 

7.9_P) (a) p = 3,06 a 2 = 0,3944 

(b) Al: 2,3 2,5 / A2: 2,3 3,0 / A3: 2,3 3,5 / A4: 2,3 4,0 / A5: 2,5 3,0 / 
A6: 2,5 3,5 / A7: 2,5 4,0 / A8: 3,0 3,5 / A9: 3,0 4,0 / AIO: 3,5 4,0 

(c) X = 2,4; X 2 j= 2,65 ; X 3 = 2,9 ; X 4 = 3,15; X, = 2,75; X 6 = 3,0 

X 7 = 3,25; _X a = 3,25; X g ^ 3,5; X 10 = 3,75 

(d) De fato, E(X) = 3,06 e Var(X) = 0,1479. 

7.10_P) (a) (0,822 ; 0,855) 

(b) 1C conservativo: (0,254 ; 0,546); IC não conservativo : (0,257 ; 0,543) 

Capítulo 8 

8.1_P) (a)F (b)F (c)V (d)V (e)F 
8.2_P) (a)V (b)F (c)F (d)V (e)F 
8.4_P) (a) 0,0082 (b) 0,0548 

8.5_P) (a) A hipótese nula (p < 0,50) não é rejeitada ao nível de significância de 5%. (b) 
0,0636 

8.8_P) (a) Consultando a Tabela IV do Apêndice II: p-valor está entre 0,10 e 0,25. 
Usando-se um software: p-valor = 0,1368. Portanto, não há evidência para rejeitar a hi¬ 
pótese nula, ou seja, há indicação de independência entre a faixa etária e a preferência 
pelo tipo de programação cultural. 

(b) p-valor=0,0004, portanto rejeita-se Ho, ou seja, mais de 20% da população em 
questão prefere shows musicais. 

8.11_P) (a) a = 0,0853 (b) (3 = 0,8286 (c) (3 = 0,7817 

8.12_P) A ANOVA indica que existe diferença significativa entre as três médias 
(p-valor = 0). Fazendo as comparações múltiplas, constata-se que existe diferença entre 
os cursos A e C, e também entre B e C, mas não entre A e B. 
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•siejuaujeiJodLuoD sasaiodjq jejsaj e a o|apooi op sojjauiejed so jeoipsa e 
'sejjsouue luod jepn e soujapuajde mby epuaja^ui ep seDjuaaj sep osn oe epe||e 
'sjejjsouie sopep ap eja|oa ep opiu jod epjznpaj aiuauuiepuejsqns jas apod sjeuope|ndod 
sojiaujejed sop jo|ba o ajqos ezauaauí voeí>e|ndod e ejed ejjsouje ep 'eíwejnbas iuod 
' saosnpuoa se Jipuedxa uuajjiujad eaqsjjeisg epuaja^ui ep souoieuujyuoD sopoiaoi so 

VDI1SJ1V1S3 VDN3d3dNI 

sejunõjad sessa ejed sejsodsaj sjdAissod 
jeajpuj easnq oja|| o iezajjaauj essou e jeaypuenb ejed 
o|apouj assa jesn 00103 isssajaju! ap ouauiouaj o aiuaujeDqeuiaieui BAajasap anb 
ODpsjiiqeqojd o|apooi um jeinuuoj 00103 oespap eujn jbuioj ap apeppsaaau ep ajueip 
'jajjoao ojuaAa opep um ap apepwqeqojd e jaaaquoa souiefasap 'smaj saoienus sejmuj uig 

sdavamavaoad 3a cnroTO 

•oprusa uia ouauioua^ op oesuaajdujoD e uiejjipej 
anb soayejb a sajopeDipuj 'se|aqej ap oeímjjsuoa e eAa| sou euojejo|dxg asqeuv V sopep 
sou epquoa oeieuuoju! e jjuinsaj e a jjejjxa e souieupua 'ajjed ejsaiq laAjuodsip oeí>euuoju! e 
ujod oiejuoa ojiauiud um jbuioj e epnfe sou anb sopep ap ojuaoiejeji ap seamaaj ap ojuníuo3 

viapivaoidX3 3snvNV 

:saued sajj uia opjpjAjp jas apod oja(| op oauoai leuaieui o 

■|!jn ejuaoiejja^ eujn a eapsjiejsg e anb uia oiuauipaquoa op 
seaje sesjaAjp opuaõuejqe 'sojsodojd soppjaxa a soppiosaj soppjaxa 'so|duiaxa jod 
epeiuauja|dujoa a euoaj v opejuasajde a oauoai leuajeui o |enb ep jqjed e eiajauoa oeiemis 
etun opupnDSip eiauioa o|njidea epe3 eApejpuenb eaje eu epejjuaD ejsa oeu oeí>euuoj eína 
oai|qnd um ejed eajsçg eapsjjejsg ep sojjaauoa so a sejapj se jejuasajde apuajajd oja|| ajsg 

















